前openai 核心创始人karpathy:智能体读取agents. md 文件

最近,像 ClaudeCode、Cursor 这些编程智能体还有“龙虾”App火了,一个叫AGENTS.md的文件也跟着被大家熟知。不过,这个文件真的能让智能体变聪明吗?前OpenAI核心创始人Karpathy在X上回帖直接说:其实并不是这样。 Karpathy提到,智能体写的代码乱七八糟,根本不听他在AGENTS.md里的指令,他只能接受这一现状。这个消息让很多开发者都震惊了。 有次主流编程智能体产品Opencode的成员Rhys Sullivan问Karpathy对生成的代码质量满意吗,还是只要能运行就行。Karpathy回答说不满意,觉得这些智能体会让代码结构臃肿,美感也很差。不过他也说,到了这个阶段他也不想再和它对抗了,只能接受现状继续前进。 Karpathy还揭露了一个大家都觉得痛苦但没人敢说的问题:这些智能体根本不听我写在AGENTS.md里的指令。比如我强调每一行代码只做一件事,用中间变量说明,但是它们还是会写出复杂的结构。他表示虽然理论上可以用hooks或slash commands清理这些问题,但有时候耸耸肩反而更省事。 他还提到用大模型作为奖励裁判并不完全靠谱。另外他觉得用LLM作为soft reward的评判者有隐患,比如Goodhart定律的问题。不过现在实际应用中还有很多低垂的果实没有被充分利用。 Brennan McEachran是YC孵化出来的创业者,他也认同这一看法:智能体读取AGENTS.md方面表现不好。他分享了个小技巧:在创建PR之前先跑一遍review风格的prompt就好很多。他还透露Codex团队就在单独训练这块。 还有个叫Morgan的开发者是boldmetrics联合创始人兼CTO,他看完Karpathy的帖子后也发表了看法:AGENTS.md可能会让你的编程智能体更糟!他甚至认为这个文件弊大于利。他试过疯狂优化自己的AGENTS.md文件和阅读别人的反馈后得出结论:对很多人来说带来伤害可能大于帮助。 Morgan还提到以前以为只是自己一个人的问题,但看到Karpathy的帖子后意识到这是普遍现象。问题出在哪里?Anthropic和OpenAI都在忙着解决呢。