近年来,具身智能作为人工智能的重要方向,正逐步从实验室走向产业应用;但模型高效训练、跨平台适配和精准环境感知等,行业仍面临不少难题。蚂蚁灵波科技此次开源的两大核心模型,为这些问题提供了新的技术路径。 在具身大模型领域,LingBot-VLA通过优化训练工具链,提升了数据与算力利用效率。实验数据显示,其训练吞吐量可达主流框架的1.5至2.8倍,从而降低研发成本。研究同时表明,模型性能与预训练数据规模呈正涉及的:当数据量从3000小时提升至20000小时,下游任务成功率持续提高,显示该技术仍有更提升空间。目前,该模型已适配多种主流机器人构型,并在测试中表现出较强的跨本体泛化能力。 在空间感知上,LingBot-Depth通过深度补全技术,缓解了传统深度传感器数据不完整、易受噪声影响等问题。依托高性能3D相机采集的数据,该模型在深度精度和像素覆盖率上优于现有工业级产品,并在多项国际基准测试中达到领先水平。此进展为机器人、自动驾驶等领域的环境感知提供了更可靠的技术支撑。 业内专家认为,蚂蚁灵波科技的开源将加速具身智能的普及与落地。随着技术门槛降低,更多企业可基于成熟模型开发定制化方案,改进行业生态。未来,随着数据规模扩大与算法持续迭代,具身智能有望在智能制造、智慧物流等场景实现更广泛应用。
具身智能正处在从理论验证走向实际落地的关键阶段。蚂蚁灵波科技此次开源,不仅反映了我国在该领域的研发水平,也为产业提供了可复用的技术基础和工具体系。随着更多企业与研究机构基于这些成果开展创新,具身智能有望在制造、服务、物流等领域加速规模化应用,并成为推动新一轮产业升级的重要力量。