大晓机器人王晓刚:现在得用“世界模型”

现在的人形机器人虽然看着能用,但普遍都不够聪明,王晓刚觉得主要是泛化能力不行,其实就是两个关键问题。商汤联合创始人、大晓机器人董事长王晓刚在博鳌亚洲论坛2026年年会现场和大家聊起这个话题时指出,主要是数据和模型这两块没弄好。他说之前靠人操控真机器去采集数据的方式有大毛病,不仅不是在真实的生产生活中收集的,效率也低得吓人。“过去几年总共积累了10万小时的数据,跟我们要达到千万小时的目标差得太远了。” 为了解决这个问题,大晓机器人打算在2025年搞个“环境式数据采集”,就是利用像第一视角眼镜、穿戴设备还有第三视角传感器这样的工具,让人在干活的时候自然地把数据记下来。“比如保洁阿姨在扫地的时候顺手就把数据录进去了,这样积累起来就快多了。要是有1000个人带着这种设备去干活,一天就能攒下1万小时的数据。” 他还提到以前那种用机器采集的是死数据,换个型号还得重来一遍;而这次录下来的是人干活的视频,以后不管是啥型号的机器人都能用这套资料去调整参数。至于模型方面,以前的VLA模型是和本体死磕在一起的,就像机器人接了命令直接照着模板走一样。王晓刚说这样不行,现在得用“世界模型”。他解释说这个模型能让机器人更明白物理是怎么回事、人做事有啥逻辑,通用性强还能搞定复杂活。 他觉得以后不一定非选一个不可,完全可以把世界模型和VLA模型放在一起用。比如在机器人“大脑”里给两块GPU分别装上两种模型:一块负责规划复杂任务,像写剧本一样一步步来;遇到简单活就让VLA去干;如果看到的情况和脑子里想的不一样,“世界模型”就得赶紧重新算一遍。