kimi k2.5 背后的技术细节

3月18日，英伟达在GTC2026大会上给AI圈带来了不少惊喜。杨植麟，这位Moonshot AI的创始人，这次是头一回公开分享Kimi K2.5背后的技术细节。他把大模型的未来方向直接指向了Token效率和Agent集群这两个关键点。他认为，现在的Scaling已经不光是算得快，更是要在效率、记忆和协作上找新出路。只要能把这三个维度的效果叠起来，模型的智商就能突飞猛进。杨植麟这次重点聊了怎么把智能形态从单干变成动态生成的数字集群。他还特意提到要给核心技术来个“推倒重来”，比如优化器、注意力机制这些东西。只有这样，才能打破智能的天花板。Kimi K2.5就是他这套思路的产物，这是今年1月底刚发的。作为月之暗面最强的开源模型，它不仅能写代码、看图片，还是那种state-of-the-art水平，还能在“思考”和“非思考”模式间随便切换。现在大家已经不再比谁的参数量大了，比赛重点转向了“智能密度”。如果以后智能体都是成群结队的，那Kimi能不能在杨植麟这套“三维相乘”的逻辑里跑得飞快，这是大家都在盯着看的事儿。这时候的Scaling就成了在效率、记忆和协作上找规模效应。杨植麟说，要是把这几个维度的增益相乘起来，模型的智商肯定会爆炸式增长。