小米终于对那个一直传得沸沸扬扬的超级模型给出了明确答复。3月19日这天,罗福莉直言MiMo-V2系列会开源。这个月初,一个叫“Hunter Alpha”的神秘家伙在OpenRouter这个全球最大的API聚合平台上彻底火了,一度冲到了调用榜的首位,很多人都以为是“DeepSeek V4”的早期测试版本。结果到了19日凌晨,小米直接认领了“Hunter Alpha”,同时宣布要推出三款大模型,分别是MiMo-V2-Pro、Omni还有TTS,给大家免费试用一周。 紧接着,罗福莉发了一篇长文来解释这事。她把这一连串的举动称作一次“悄无声息的伏击”,并不是说事先有什么计划,而是因为从聊天模式转向智能代理模式的速度实在太快,就连团队自己都感到震惊。在这之间的过程充满了惊喜和挑战,也充满了吸引力。其实早在几个月前,小米就开始训练1T的基础模型了,当时的目标就是提升长文本的推理效率。后来引入的混合注意力机制算是个大创新,既没让系统变得太臃肿,也被证明是智能体时代的最佳基石。 现在MiMo-V2系列支持1M的上下文窗口,配合MTP推理还能实现超低延迟和低成本。这些架构上的决定都不是一时头脑发热做出来的,而是在问题出现之前就做好了准备。最关键的是罗福莉第一次体验到复杂的智能体框架时感到无比震撼。她形容那是一种“精心编排的语境”,第一天就把她给惊着了。为了让团队跟上节奏,她下达了一道很硬核的命令:MiMo团队里明天对话次数少于100次的成员可以辞职走人。这招还真挺管用。 大家问为什么小米发展这么快?罗福莉拿自己做DeepSeek R1的经验来说事。她总结出几个要点:——搞基础设施需要长期的战略决心;——产品迭代要靠直觉驱动;——好奇心、技术直觉和执行力必不可少;——还有一个常被忽视的是对所创造世界的热爱。最后她还特意提到,等新的MiMo-V2系列足够稳定、有了开源的价值的时候,肯定会把它放出来给大家用。本文源自IT之家。