“大脑”的大模型却跟不上,就是缺少真实场景的数据来训练

说起具身智能,这玩意儿现在是真火,各大厂都在往里砸钱搞研发。不过话说回来,这行其实挺难搞的,“小脑”也就是运动控制这块技术进步飞快,“大脑”的大模型却跟不上,就是因为缺少真实场景的数据来训练。这事儿放在3月16日那天,京东算是搞了个大新闻,他们说要依托超级供应链的底子,把零售、物流、健康这些大业务场景的优势全都用上,弄一个全球最大的具身智能数据采集中心。计划两年内搞到超过1000万小时的优质数据,把这个行业从以前的算法仿真阶段,真正给推到用真实数据来驱动的新阶段。 这就好比汽车没有油开不动一样,数据对具身智能来说就是必不可少的“燃料”。京东之前就已经弄出了行业领先的机器人数据采集中心,“采集、标注、训练、验证”这一整套流水线都建起来了,覆盖了物流仓储、工业制造这些大的核心场景。视觉、触觉还有空间轨迹这些维度的数据都能给记下来。另外,京东手里拿着20多年积累下来的丰富场景资源,打算发动几十万人一块儿来搞数据采集。里头既有内部超过10万名的各类职业员工,也有外部最多50万来自各行各业的人。 光说外部的人也不行,在宿迁这个地方,他们还会发动超10万市民一起来参与。这些人去记录的场景可多了,不管是家里、办公室、工厂还是物流点、商店、餐厅、医院、环卫站这些地方都有,把人类日常生活的方方面面都给覆盖了。这算得上是人类历史上规模最大的一次数据采集行动了。 通过这一系列的操作,京东预计一年之内就能积累500万小时的人类真实场景视频数据。等两年过去,这个数字能突破1000万小时,同时还能搞定100万小时的机器人本体数据。到时候京东就能变成全球最大的具身智能数据公司了,直接从源头去破解行业里的“数据荒”。有了这么多数据撑着,“大脑”和“小脑”就能协同进化得更快。这么一来,京东做出来的具身模型不光是会“看”和“动”,更关键的是学会了怎么去“理解”这个真实的世界。