谷歌的Gemini 3 Deep Think有了新升级,它把科学、研究和工程领域都考虑进来了,叫“推理模式”。新版的Deep Think是由谷歌的开发人员和各行各业的科学家们一起搞出来的,目的就是为了应付那些现实中复杂的问题。比如数据杂乱、没有清晰的边界、问题的解决办法也不一定唯一。这次升级让Deep Think的范围扩大了,谷歌说从2月12日开始,Ultra订阅用户就能在Gemini应用里用它了。另外,谷歌也给研究人员、工程师和企业提供了API访问权限,这个计划叫“早期访问计划”,大家可以去申请试试看。 能力方面也有很大提升,尤其是在数学、算法和编程这些需要高难度推理的任务上。这个模式不用任何工具就能在Humanity's Last Exam上拿到48.4%的成绩,在ARC-AGI-2上更是达到了84.6%,而且这个成绩也被ARC Prize Foundation验证过了。在Codeforces的竞赛编程基准上拿到3455的Elo分数,还有在2025年的国际数学奥林匹克竞赛IMO 2025上表现也很出色。 除了数学和编程,Deep Think在化学、物理这些科学领域也很厉害。官方说它在2025年的国际物理奥林匹克和国际化学奥林匹克的笔试部分表现得跟金牌得主差不多。甚至在理论物理相关的CMT-Benchmark上也拿到了50.5%的高分。 谷歌不是为了刷成绩才搞这个更新的,他们希望它能真的帮助实际的工程和科研工作。比如帮助研究人员解释复杂数据,或者帮助工程师用代码去建模物理系统。未来他们还会继续努力把Deep Think带到大家最需要它的地方去。通过Gemini API开放早期访问被认为是重要的一步。