过去一年,AI 行业的竞争焦点仍大量集中在模型本身:谁的 benchmark 更高,谁的推理能力更强,谁在排行榜上领先。但随着 Claude Code、Skills、MCP、项目记忆、Agent 工作流等产品能力不断完善,一个更清晰的趋势正在出现:模型本身只是产品的一层,真正决定用户产出效率的,是包裹模型的上下文、记忆、工作流、技能、连接器、文件结构、风格指南和目标循环。
Karpathy 过去几个月反复强调的「context engineering」,正好对应了这一变化。真正决定 AI 能否产生稳定价值的,不只是用户写下的一条 prompt,而是模型能否理解你的文档、工作流、风格标准、业务目标和判断体系。换句话说,AI 的下一阶段竞争,可能不再只是「谁的模型更强」,而是谁能让模型更好地进入真实工作场景。
从 LLM Wiki 到 AutoResearch,再到 /goal 这类目标驱动式循环,Karpathy 公开探索的方向一直围绕同一个问题:如何让 AI 从「回答问题的聊天窗口」,变成一个能理解上下文、持续执行任务、围绕目标迭代的工作系统。而 Anthropic 最近在 Claude Code、企业服务、生态连接器和工作流能力上的布局,也正沿着同一条路径展开。
因此,Karpathy 加入 Anthropic 的意义,不只是一次人才流动,而像是对 Anthropic 产品路线的一次注脚:未来的 AI 工具,价值不只在模型参数里,也在用户沉淀的数据、工作流、记忆系统和行业知识中。谁能把这些上下文组织起来,谁就可能真正把 AI 从「工具」推向「基础设施」。