张予彤:中国ai 为何能这么快发展?

北京时间1月21日的晚上,瑞士达沃斯这里可热闹了。世界经济论坛2026年年会专门搞了场讨论,大伙儿都在琢磨人工智能未来咋样。中国的一个小公司——月之暗面(Moonshot AI),这回可是彻底火了。他们的总裁张予彤在会上大手一挥,说他们很快就会推出个新模型。这动静可不小,不光是咱们国家的大语言模型技术进步得快,也把中国科技企业那股务实创新劲儿给展现出来了。 其实在宣布之前,也就是1月20日那天,月之暗面已经偷偷摸摸开启了新模型API的内测报名通道。看来他们技术早就熟了,就等着放出来让大家一起玩了。从实验室里搞出来到真能给产业用,咱们的节奏真的是越来越快了。 张予彤在现场分享的时候,特别提了提他们家的Kimi模型系列。她说说实话,Kimi团队只用了美国顶尖实验室大概1%的算力资源,就搞定了像Kimi K2、Kimi K2 Thinking这种全球都能打的开源模型。最让人想不到的是,这几个开源家伙在评测里头居然把一些美国最牛的闭源模型都给比下去了。 这简直是在挑战以前的老观念啊——以前总觉得谁家算力多谁家就厉害。这次可是实实在在证明了算法和工程优化才是真金白银。她们家为啥能这么牛?还不是因为理念和做法跟别人不一样。 张予彤透露说,她们做研究从来都不只是纸上谈兵。她们坚信把深度工程化的思维从头到尾贯穿进去,这样不管搞出什么新算法,在真实复杂的环境里都能跑得稳、跑得好。这种“研用一体”的风格,才是她们能快速迭代、产出效率高的根本原因。 具体的技术亮点还真不少。举个例子吧,她们是全球头一家在大型语言模型训练里用上Muon优化器的公司。这个优化器能把训练变得更稳定也更高效。还有她们自研的Kimi Linear注意力机制也挺厉害,处理超长上下文的时候比传统系统快得多。这就是解决大模型处理长文本难题的新办法。 除了聊技术本身,张予彤还从大方向上分析了中国AI为啥能这么快发展。她觉得有三大优势特别明显。首先就是中国有全世界最完整、最大的制造业体系和电商零售网。这就意味着咱们有海量的数据、复杂的需求和现成的试验场。 比如说智能供应链管理或者个性化消费服务这些场景不断提出问题,逼着技术去迭代;再比如工业质检或者智慧城市建设这些地方也有很多实际需求等着解决。这种丰富的场景不断反哺技术进步。 第二个优势是中国人的心态特别好。不管是企业还是老百姓都喜欢用能真真切切提高效率、优化流程、改善体验的工具。这种务实的文化让新技术能很快从实验室走进车间、办公室甚至生活里。 第三个优势就是“基建先行”的战略眼光高。中国在5G、数据中心这些数字基建还有特高压输电、新能源体系这些能源基建上布局早、建设多。 这种先把路修好的做法保证了算力、数据流通和能源供应这些关键东西都能拿到手还能持续用下去。这就给高耗能的AI产业长期爆发式增长打下了底子。 这次月之暗面选择把Kimi K2这种核心模型开源出来其实挺有意思的。这既是技术自信的表现,也是为了融入全球开源生态里一起搞事情。通过开源能让全球开发者一起帮忙优化、应用和拓展能力;也能在更广泛的实测中检验和提升性能。 当然啦,在部分性能上能对标甚至超越国际闭源模型也是硬实力的证明。这种既“开源共享”又“尖端竞逐”的做法正在改变中国AI企业参与全球竞争的方式。 这次发布的新模型其实就是咱们中国人工智能产业蓬勃发展的一个缩影。以前咱们追求的是算力有多大现在开始更看重算法效率和工程创新了;以前可能还在后面跟着跑现在已经在多个领域并行甚至领先了。 张予彤在达沃斯论坛上的话说明了中国AI不光靠国内市场大需求多还因为有长期积累的制造业根基、创新的社会氛围和远见的基础设施战略。 接下来新一轮模型发布马上就要来了中国力量在全球AI创新版图上会扮演啥角色做出啥贡献?这确实很值得咱们持续期待和关注呢!