咱们来聊聊 OpenAI 的一个大动作,叫“北极星”计划。公司打算搞出一套全自动的多智能体研究系统,目标是在 2028 年前搞定。首席科学家雅各布·帕乔基透露,这次公司把所有资源都往这儿倾斜了,别的业务全得靠边站。今年 9 月就要出第一个成果——一个能自己干活的“自主AI研究实习生”。这不是玩概念,是实实在在的技术积累。他们把推理模型、智能体技术和可解释性研究合在一起,要弄出一个能在数据中心一直跑的AI研究员。前OpenAI研究员安德烈·卡帕西觉得这事儿太难了,是“终极挑战”。他觉得主流实验室都会往这走,现在瓶颈主要在工程上。 就 OpenAI 公布这个计划的同时,Anthropic 那边也悄悄上线了Claude Code Channels功能,让开发者用即时通讯工具就能调用 AI 写代码。这种把工具嵌进工作流的做法,跟 OpenAI 的目标有点不一样。 不过帕乔基也承认现在还没法完全管住大语言模型,只好用另一个模型去监控它的运行日志。虽然“以AI监督AI”挺有新意,但要达到安全标准还得慢慢磨。 研究人员说要搞自动化研究得满足三个条件:能改文件的智能体、客观的测试指标还有固定的实验周期。实际例子里有Shopify用夜间的智能体跑了37次实验,让模型性能提高了19%。 钱这方面赚头很大,行业预测到2029年智能体业务能挣290亿美元。高端服务一个月的费用能到2万美元,比请人干效率高多了。OpenAI 和Anthropic现在是两条路走:一个想建完全自主的体系,一个想弄好即时工具。这竞争让技术迭代特别快,从想法变成实际用的时间变短了很多。以后搞科研的人可能不再直接干活了,主要是设计系统和看结果。