这事儿就发生在不久前,咱们的硅谷新贵InceptionLabs搞出了个叫Mercury2的大家伙,这可是实实在在颠覆了之前那种慢悠悠的自回归模式。这就好比是把之前的“打字机”给扔掉了,不再是一个字一个字地往外蹦,而是像个厉害的编辑一样,先把草稿全写出来再修改,一下子就把速度给提上去了。第三方测了一下数据特别牛,每秒能生出来1009个tokens,速度比市面上的主流模型快了不止五倍。 看看价格也很实在,输入价每百万token只要0.25美元,输出价也才0.75美元,比Gemini3Flash那种大家伙还便宜不少。性能这块更是没话说,支持128K的上下文,编程、数学、科学问答这些领域表现都非常亮眼。这家公司的老板是个斯坦福大学的老教授Stefano Ermon,他从2019年开始琢磨扩散模型这门手艺。最初就是看这个模型在画画上挺有潜力,后来就想把这法子用在写文章和编代码上。经过几年死磕,终于在2025年把这个商用版的Mercury2给推出来了。 这次发布把AI圈给惊动了,英伟达那些大佬也纷纷跑来贺喜。大家都觉得这算是一次重大飞跃,以前那种自回归的老路子确实太慢了。即使有人怀念过去那个辉煌时代,但Mercury2的出现肯定会让未来的AI发展多出不少路子来。未来咱们普通用户用起来肯定更爽,响应速度更快、质量更高、价格还便宜。这就是个技术上的突破和对未来的深刻启示啊!咱们就坐等更多像Mercury2这样的新鲜货出来吧。