问题:从“会做”到“可靠做”,机器人落地仍卡稳定性上;长期以来,机器人在实验室里能完成抓取、搬运、装配等操作,但进入真实场景后,物体材质不同、摆放位置变化、光照干扰等都会放大误差,常出现“差几毫米就失败”。在家庭场景中,折叠衣物、整理杂物需要处理柔性材料;在工厂和仓储中,装箱、分拣更看重节拍和一致性。可靠性不足不只影响体验,也限制了规模部署以及安全与合规。 原因:只靠示范学习,偏离后容易误差累积。行业里常见做法是人类示范,机器人“照着做”。当动作轨迹和环境高度一致时效果不错,但只要抓手位置略偏、物体滑移或姿态变化,系统往往缺少应对“新情况”的经验,小偏差会不断叠加,最终导致任务中断。尤其在物理交互中,力、摩擦和材料形变带来强不确定性,训练数据难以覆盖所有边界情况,形成所谓“可靠性差距”。 影响:可靠性差距正成为机器人规模化应用的门槛。一上,仓储、制造、餐饮等行业强调连续运行和良品率,系统若频繁停机、需要人工救援,综合成本反而更高;另一方面,进入家庭后,物体更杂、空间更拥挤、容错更小,连基础任务都难以稳定完成,就很难建立消费者信任。资本与产业端对“能长期稳定工作”的通用机器人期待升温,也让训练方法的改进成为竞争焦点。 对策:用“示范+纠错+自我评估”补齐数据和反馈链条。该公司在旧金山一处仓库式场地进行训练与测试,提出名为Recap的训练思路:在示范学习之外增加两条关键通道。其一,当机器人出现偏差、接近失败时,由人类操作员及时介入纠正,让系统学习“如何从错误中回到正确轨道”;其二,引入强化学习评估机制,让机器人对自身动作进行归因,通过价值函数判断哪些决策推动任务走向成功、哪些会抬高失败风险,从而把不完美的经历转化为可用样本,而不是直接丢弃。公司表示,按该流程训练的视觉—语言—动作模型新版本,在折衣、装箱、制作浓缩咖啡等任务上稳定性更高,部分任务提升明显、失败率下降,并可在一定时长内连续运行。 前景:从“单点技能”走向“可复制能力”,仍要经受工程化与场景化考验。业内人士认为,纠错式训练的价值在于提升机器人面对扰动时的恢复能力,有助于提高其在厨房、洗衣房、生产线等场景的可用性。但真实部署还要解决多机协同安全、长期维护、成本控制、数据合规等问题;不同国家和行业在安全标准与责任界定上的差异,也会影响落地节奏与路径。未来,如果训练体系能在更多物体类别、更复杂空间、更长时间连续任务中保持稳定,并沉淀出可复用的数据与评测标准,机器人从“展示型能力”走向“生产力工具”的进程有望加快。
当机器具备从错误中自我修正的能力,工业智能化或许正迎来一个关键节点。物理智能公司的探索不仅为制造业升级提供了新思路,也把人机协作的边界问题推到台前——在未来工厂里,人类可能更多承担策略与监督,而把重复劳动交给机器。机遇与挑战并存,如何建立与之匹配的产业生态和社会规范,仍需要全球产学研各方持续探索。