gpt-5.4:codex的新生产力

2月5日这天,OpenAI在GPT-5.3-Codex上吹了个牛,说这是第一个自己创造出来的模型。在Cerebras硬件的加持下,它的推理速度直接干到了每秒1000tokens。到了3月5日,他们又推出了GPT-5.4,这次不仅能写代码、推理,连操控原生电脑都不在话下,上下文窗口还能容纳一百万个token。有了这些新能力,Codex一下子就能干好多以前干不了的活,不光生成代码,连项目级的安全审计也包了。在测试的时候,它扫描了120万次代码提交,硬是发现了近800个高危漏洞。这一波操作下来,开发者们发现两边都得用:ClaudeCode负责规划和搞创意,Codex专门负责写代码和优化。为什么会这么分?因为Claude像美国工程师一样有创造力,Codex像德国工匠一样能干活。数据也挺好看,Codex周活跃用户今年增长了300%,付费的人也突破了一百万,甚至因为在超级碗上打广告太火,系统都撑不住了。 OpenAI给自家工程团队下了死命令,要求必须在3月31日前把AI代理当成第一生产力,这明显是冲着竞争对手Anthropic来的。短短六周里,Codex平台一连搞了七项大更新,涉及模型升级、安全审计和跨平台支持这些事。开发者现在都学会了用双工具并行的模式干活:Claude负责出点子,Codex负责落地。Reddit的调查显示,有67%的人认可Claude的代码质量,但Codex性价比高,成了做那种需要花长时间任务的首选。某公司的首席架构师就说了这么个场景:用Codex做低延迟的系统开发,Claude去主导UI设计,两边互补得正好。这种模式正在改变化判断开发工具好不好的标准。人才方面的流动也很能说明问题。OpenClaw的创始人Peter Steinberger去了Codex这边,他特别擅长搞那种能长时间运行的代理系统。这就印证了OpenAI的野心:他们想把Codex从单纯的编码工具变成AI原生的开发平台。 工程体系上也变了样。Codex平台上超过90%的代码都是自己生成的,工程师现在不写代码了,变成了代理管理者。一个人能同时跑4到8个代理去处理不同的任务。技术选型上也换了路子,用Rust语言写的CLI工具把Type给替代了,再加上分层审查机制,把AI生成的代码通过率拉到了90%。晚上系统自动巡检发现的问题建议都准备好发给工程师了。安全这块进步也不小。CodexSecurity在研究阶段就很强了,误报率比传统工具低了50%,噪音少了84%,覆盖了OpenSSH和Chromium这些关键项目。这种从代码生成到安全审计的闭环很厉害,说明AI工具正在往开发平台的方向进化。Anthropic那边也没闲着,推出了ClaudeCodeSecurity跟Codex对着干。 人才流动显示战略重心变了。Peter Steinberger这人来了就是为了下一代个人代理开发。现在GPT-5.4都能跨应用操作了,加上正在完善的插件生态系统,这个智能平台的样子越来越清晰了——它能自己搞定从规划到部署的全流程。代码审查效率成了新的比拼重点。Codex团队透露说模型写代码的速度比人快多了,这就逼着大家想办法搞自动化验证。他们试着让AI通过重现用户操作来证明修复是有效的,这种"可证明的修复"机制可能会改变开发流程。随着3月31日的大限越来越近,OpenAI的冲刺还在继续呢。这场由编码工具引发的平台级战争正在改写人工智能的开发方式。