gpt-5.4：codex的新生产力

2月5日这天，OpenAI在GPT-5.3-Codex上吹了个牛，说这是第一个自己创造出来的模型。在Cerebras硬件的加持下，它的推理速度直接干到了每秒1000tokens。到了3月5日，他们又推出了GPT-5.4，这次不仅能写代码、推理，连操控原生电脑都不在话下，上下文窗口还能容纳一百万个token。有了这些新能力，Codex一下子就能干好多以前干不了的活，不光生成代码，连项目级的安全审计也包了。在测试的时候，它扫描了120万次代码提交，硬是发现了近800个高危漏洞。这一波操作下来，开发者们发现两边都得用：ClaudeCode负责规划和搞创意，Codex专门负责写代码和优化。为什么会这么分？因为Claude像美国工程师一样有创造力，Codex像德国工匠一样能干活。数据也挺好看，Codex周活跃用户今年增长了300%，付费的人也突破了一百万，甚至因为在超级碗上打广告太火，系统都撑不住了。 OpenAI给自家工程团队下了死命令，要求必须在3月31日前把AI代理当成第一生产力，这明显是冲着竞争对手Anthropic来的。短短六周里，Codex平台一连搞了七项大更新，涉及模型升级、安全审计和跨平台支持这些事。开发者现在都学会了用双工具并行的模式干活：Claude负责出点子，Codex负责落地。Reddit的调查显示，有67%的人认可Claude的代码质量，但Codex性价比高，成了做那种需要花长时间任务的首选。某公司的首席架构师就说了这么个场景：用Codex做低延迟的系统开发，Claude去主导UI设计，两边互补得正好。这种模式正在改变化判断开发工具好不好的标准。人才方面的流动也很能说明问题。OpenClaw的创始人Peter Steinberger去了Codex这边，他特别擅长搞那种能长时间运行的代理系统。这就印证了OpenAI的野心：他们想把Codex从单纯的编码工具变成AI原生的开发平台。工程体系上也变了样。Codex平台上超过90%的代码都是自己生成的，工程师现在不写代码了，变成了代理管理者。一个人能同时跑4到8个代理去处理不同的任务。技术选型上也换了路子，用Rust语言写的CLI工具把Type给替代了，再加上分层审查机制，把AI生成的代码通过率拉到了90%。晚上系统自动巡检发现的问题建议都准备好发给工程师了。安全这块进步也不小。CodexSecurity在研究阶段就很强了，误报率比传统工具低了50%，噪音少了84%，覆盖了OpenSSH和Chromium这些关键项目。这种从代码生成到安全审计的闭环很厉害，说明AI工具正在往开发平台的方向进化。Anthropic那边也没闲着，推出了ClaudeCodeSecurity跟Codex对着干。人才流动显示战略重心变了。Peter Steinberger这人来了就是为了下一代个人代理开发。现在GPT-5.4都能跨应用操作了，加上正在完善的插件生态系统，这个智能平台的样子越来越清晰了——它能自己搞定从规划到部署的全流程。代码审查效率成了新的比拼重点。Codex团队透露说模型写代码的速度比人快多了，这就逼着大家想办法搞自动化验证。他们试着让AI通过重现用户操作来证明修复是有效的，这种"可证明的修复"机制可能会改变开发流程。随着3月31日的大限越来越近，OpenAI的冲刺还在继续呢。这场由编码工具引发的平台级战争正在改写人工智能的开发方式。