Moonshot AI创始人杨植麟出席英伟达GTC大会 展示中国AI创新成果

问题——全球大模型技术竞速正进入“工程效率”的深水区。随着参数规模不断扩张、应用场景延伸到多模态与智能体,训练成本、算力利用率以及数据与系统协同等矛盾愈发突出。对开发者和企业来说,仅靠堆叠算力已难以支撑持续迭代,如何既定硬件条件下实现更高吞吐、更快收敛和更稳定的训练流程,成为行业共同面对的核心问题。作为全球计算生态的重要交流平台,GTC长期被视为观察新架构、新系统与新工具进展的窗口。原因——产业动力正从“规模扩张”转向“效率与落地”。一上,算力供给、能耗约束与训练周期要求叠加,使训练成本与不确定性深入放大;另一方面,应用端对长上下文理解、连续任务执行和可控输出提出更高标准,推动底层算法与系统工程协同优化。这个背景下,从优化器、训练框架到注意力机制等“基础改造”,更容易沉淀为可复用的通用能力,并通过工程化快速扩散到产业链各环节。影响——中国团队登台,折射全球创新生态更加多元。会议议程显示,当地时间3月17日11时,杨植麟将围绕团队在训练效率提升上的探索进行主题分享,内容包括:Muon优化器带来的token学习效率提升、与“Day 0”基础设施协同设计有关的吞吐优化,以及面向长时序智能体的训练框架与线性注意力架构思路。业内认为,这类从算法到系统的联动设计,若能在更广泛的硬件平台与应用场景中验证,有望降低训练门槛、缩短迭代周期,让开发者把更多资源投入应用创新,而不是反复搭建同类基础能力。同时,受邀参与国际顶级开发者大会,也为中国创业团队与全球工程社区建立更直接的交流渠道,便于在开放讨论中检验技术、形成共识并拓展合作空间。对策——用可复现的工程实践推动良性竞争。面对大模型训练与部署的长期挑战,业内普遍关注三点:其一,强化基础研究与工程能力的结合,通过优化器、算子、并行策略和编译体系等底层能力提升单位算力产出;其二,重视标准化与可复现,推动训练框架、评测基准和安全治理方法更透明、可验证,减少无效消耗;其三,围绕应用需求持续迭代,在长上下文、工具调用、记忆与规划等能力上形成更系统的路线,避免只在单点指标上“内卷”。从企业实践看,开放接口、完善开发者文档与工具链,也更有利于形成健康的生态循环。前景——大模型竞争将更看重“效率、可靠与场景适配”。业内人士指出,未来相当长一段时间内,决定产业格局的不会是单一的参数规模,而是综合能力:训练与推理成本、稳定性与可控性、对行业数据与业务流程的适配程度,以及能否形成可持续的开发者生态。GTC的交流与展示预计将进一步强化“软硬协同、系统工程驱动”的技术路径。对中国企业而言,在推进自主创新的同时,积极参与国际技术交流、以开放合作促进互学互鉴,将更有助于把工程经验转化为可复制、可扩展的产业竞争力。

杨植麟亮相国际顶级科技盛会,表明了中国科技创新能力的持续提升;在全球科技竞争加速演进的背景下,越来越多年轻科研人员以扎实的研究能力和工程化实践走向国际舞台,为技术进步提供来自中国的思路与方案。这既反映了人才培养与科研体系的积累,也为跨国技术交流与合作带来新的增量。随着更多青年力量在国际舞台持续输出成果,中国在全球科技创新版图中的影响力有望继续增强。