当前,具身智能正从概念验证走向工程化落地,训练与推理对算力密度、软件栈成熟度、算子覆盖完整性以及软硬协同能力提出更高要求。
尤其在长时序、多视角、动态交互等任务中,模型不仅需要更强的并行计算与更低的通信开销,还依赖完善的算子生态与稳定的工程化工具链。
算力与模型“能跑”只是起点,“跑得快、跑得稳、跑得省”才决定能否进入规模化应用阶段。
围绕这一产业共性难题,沐曦股份近日与大晓机器人正式签署战略合作协议,提出以双方核心资源为基础,在技术创新、产品研发、生态构建与商业落地等方面形成长期协同。
合作进展之一是开悟世界模型3.0与沐曦C系列GPU完成适配,并进一步实现与沐曦下一代C系列GPU的“Day 0”适配,即在新一代硬件推出首日即可获得软件与模型支持。
这类首日适配能力,反映的不仅是单点性能优化,更是芯片架构、编译链路、算子实现与模型工程之间的体系化协同水平。
从原因看,具身智能面向真实世界运行,任务复杂度高、数据模态多、链路长,往往受限于算子不全、编译效率不足、内存与带宽瓶颈以及工程部署复杂等问题。
过去一段时间里,部分高阶模型在国产算力平台上存在“可用但难以充分发挥”的情况,核心原因在于软硬适配深度不足:一方面,通用算子与行业特定算子之间存在缺口;另一方面,模型结构与硬件执行单元之间缺乏细粒度对齐,导致利用率不高、端到端效率受限。
要解决这一矛盾,需要从模型设计、算子实现、编译与调度策略到运行时体系进行联合优化,而非单纯堆叠硬件指标或单独改动模型。
据合作方披露,开悟世界模型3.0采用芯片与模型协同编译方案,并对关键算子耗时开展针对性优化,使模型运行性能获得显著提升,部分场景下可实现数倍级增长。
双方还联合建设专属算子库,将世界模型所需算子数量进一步扩展,实现对长时序、多视角等复杂场景的全算子覆盖。
与此同时,大晓机器人基于沐曦芯片架构定制算子设计,提升硬件算力利用水平,意在把国产算力潜能从“可用”推进到“高效可用”。
这一进展带来的影响主要体现在三个层面。
其一,对产业链而言,软硬一体化协同有望降低研发与部署门槛,缩短模型从训练到推理再到应用集成的周期,提升迭代速度。
其二,对生态建设而言,“Day 0”适配体现出更强的工程组织与生态协同能力,有助于形成围绕国产GPU的开发者工具、算子库、模型适配与应用方案的正向循环。
其三,对应用落地而言,具身智能对稳定性、实时性和成本敏感度较高,性能提升与全栈适配将提升其在机器人等核心场景中的可行性,为规模化试点与商业化提供基础条件。
在对策路径上,双方合作强调从底层算力到上层智能应用的联动推进:一是以协同编译与算子级优化为抓手,提升端到端效率与可控性;二是以算子库扩展与全算子覆盖为基础,补齐复杂场景的工程能力;三是以国产算力基础设施为载体,构建训练与推理闭环验证体系,推动从单点适配走向平台化交付。
按照合作安排,双方将推进具身模型在国产芯片生态中的研发与应用,面向机器人企业联合构建全栈解决方案,并优先在相关算力基础设施中开展规模化落地验证。
值得关注的是,合作方还提出与相关企业共同打造“算力+模型+应用”的全国产化方案闭环与交付能力。
这意味着产业协同的重点将从单一企业技术突破,进一步转向“可复制、可交付、可运维”的工程体系建设。
对具身智能而言,只有形成可标准化的工具链、可持续迭代的模型能力与可落地的行业方案,才能在多样化场景中稳定扩张,避免陷入“实验室强、工程落地弱”的困境。
展望未来,具身智能竞争将越来越体现为体系能力之争:既看芯片算力与能效,也看编译器、算子生态、数据闭环、模型迭代与行业交付。
国产软硬协同的持续深化,有望推动更多关键能力在本土生态中沉淀并形成规模效应。
但也应看到,从“适配成功”到“行业普及”仍需跨越多道关口,包括应用场景的标准化、可靠性验证、长期运维体系、生态伙伴协作以及成本与供给稳定性等。
随着“首日适配”与联合优化机制常态化,具身智能产业有望在更可控的技术底座上加速演进。
大晓机器人与沐曦股份的合作,体现了当前国产AI产业发展的新趋势——从单点技术突破向系统性、生态化创新转变。
这种芯片与模型的深度协同,不仅填补了技术空白,更重要的是建立了一种可复制、可推广的协同创新模式。
随着越来越多的企业参与到这一生态中,国产具身智能产业有望形成完整的产业链闭环,为中国人工智能产业的自主可控与高质量发展注入强劲动力。
这也提示我们,在关键技术领域实现突破,需要上下游企业的紧密合作与资源整合,单凭一家企业的力量往往难以成事。