就在今年,也就是2024年10月的时候,罗福莉刚一加入小米,就作为合作者参与了和北京大学的一次合作研究。当时她主要是围绕MoE架构跟强化学习的结合来做工作,这个论文成果给她在小米的生涯开了个好头。到了2025年,罗福莉又公开亮相了,这是她加入小米后透露的第二项重大技术突破。 这次她和北大一起搞出了个叫ARL-Tangram的统一资源管理系统,这个系统非常管用。它用了一种统一的动作级公式还有弹性调度算法,不管是啥样的异构资源条件都能搞定,还能把动作完成时间(ACT)优化得特别好。数据显示,在现实中的强化学习任务里,用了ARL-Tangram之后,平均ACT能提升到4.3分那么高。训练步骤的时间也被压缩了不少,最多能压到原来的1.5倍,更关键的是资源消耗节省了71.2%。 其实小米很早就在这个领域布局了。这次的研究也是和小米MiMo大模型团队一起搞的,罗福莉现在是这个团队的负责人。她在社交平台上还发过感慨:"智能总会从语言世界走向物理世界的。"她觉得自己在Xiaomi MiMo里很有干劲,跟一群有才华又热爱AI的人一起奋斗,目标就是AGI。 这个ARL-Tangram的论文已经发出去了,里面的实验数据给AI资源管理领域提供了新的办法。它不仅证明了产学研合作有多厉害,也说明小米在AI基建这块的竞争力正在慢慢变强。