科技企业领军人物杨植麟:中国大模型技术需从“好用”向“规则制定者”跨越

1月10日,在清华大学基础模型北京市重点实验室主办的前沿峰会上,人工智能大模型企业月之暗面创始人兼首席执行官杨植麟发表重要讲话,阐述了中国大模型技术发展的战略思考和未来规划。

杨植麟指出,自2019年以来,全球大模型发展遵循一个核心规律,即通过增加算力、数据和模型参数来提升智能水平。

这一发展路径的实现主要依托Transformer架构的技术支撑。

相比早期的LSTM架构,Transformer在处理复杂长文本任务时展现出显著优势,能够更好地维持逻辑关系的连贯性。

在技术创新方面,月之暗面取得了两项关键突破。

首先是推出MUON二阶优化器,相较于业界广泛使用的Adam优化器,新优化器将学习效率提升一倍,大幅降低了模型训练所需的数据量。

其次是研发Kimi Linear架构,有效解决了传统技术在长时间记忆方面的稳定性问题,在处理百万字级长文本时速度提升6至10倍。

据了解,该公司还攻克了MUON优化器训练中的技术难题,通过动态QK-clip技术实现了万亿参数级模型的稳定训练。

作为中国首个真正意义上的Agent模型,Kimi K2具备数百步工具调用能力,能够独立完成复杂编程和难题推导等任务,在核心测试中准确率达到45%,超越了同类国际先进模型。

从市场表现来看,月之暗面发展势头强劲。

据杨植麟透露,公司已完成5亿美元C轮融资,账面现金储备超过100亿元人民币。

在用户增长方面,全球付费用户数月增速达到170%,海外大模型接口收入增长4倍,显示出强劲的市场竞争力。

杨植麟特别强调,目前已有多款中国开源模型成为行业测试标准,这表明中国在大模型领域不仅要追求技术实用性,更要积极参与国际规则制定。

这一观点反映了中国科技企业在全球技术治理中的责任担当和战略眼光。

展望未来发展,月之暗面将持续推进技术迭代升级。

下一代模型将采用Kimi Delta Attention新型线性注意力机制,进一步提升处理各类文本任务的性能和速度。

同时,未来的大模型还将具备更丰富的价值判断能力,避免同质化发展趋势。

针对公众关注的安全问题,杨植麟表达了理性而积极的态度。

他认为,人工智能技术可能成为人类探索未知领域的重要工具,有助于攻克重大疾病、解决能源危机、推进宇宙探索等人类共同挑战。

虽然技术发展存在一定风险,但放弃发展就等于限制人类文明进步的可能性。

按照规划,月之暗面将在做好风险控制的前提下持续技术突破,计划在未来十年至二十年内陆续推出K4、K5直至K100系列模型,为人工智能技术的长期发展奠定坚实基础。

大模型竞争的核心正在从“看谁跑得快”转向“看谁跑得稳、跑得久”。

在技术攻关与商业落地并行的同时,更需要以开放标准、工程能力与安全治理构建长期优势。

把关键技术做扎实,把规则与生态做起来,把风险边界守牢,才能让大模型更好服务科技进步和产业升级,并在全球创新格局中形成更具持续性的影响力。