“大脑”的大模型却跟不上，就是缺少真实场景的数据来训练

说起具身智能，这玩意儿现在是真火，各大厂都在往里砸钱搞研发。不过话说回来，这行其实挺难搞的，“小脑”也就是运动控制这块技术进步飞快，“大脑”的大模型却跟不上，就是因为缺少真实场景的数据来训练。这事儿放在3月16日那天，京东算是搞了个大新闻，他们说要依托超级供应链的底子，把零售、物流、健康这些大业务场景的优势全都用上，弄一个全球最大的具身智能数据采集中心。计划两年内搞到超过1000万小时的优质数据，把这个行业从以前的算法仿真阶段，真正给推到用真实数据来驱动的新阶段。这就好比汽车没有油开不动一样，数据对具身智能来说就是必不可少的“燃料”。京东之前就已经弄出了行业领先的机器人数据采集中心，“采集、标注、训练、验证”这一整套流水线都建起来了，覆盖了物流仓储、工业制造这些大的核心场景。视觉、触觉还有空间轨迹这些维度的数据都能给记下来。另外，京东手里拿着20多年积累下来的丰富场景资源，打算发动几十万人一块儿来搞数据采集。里头既有内部超过10万名的各类职业员工，也有外部最多50万来自各行各业的人。光说外部的人也不行，在宿迁这个地方，他们还会发动超10万市民一起来参与。这些人去记录的场景可多了，不管是家里、办公室、工厂还是物流点、商店、餐厅、医院、环卫站这些地方都有，把人类日常生活的方方面面都给覆盖了。这算得上是人类历史上规模最大的一次数据采集行动了。通过这一系列的操作，京东预计一年之内就能积累500万小时的人类真实场景视频数据。等两年过去，这个数字能突破1000万小时，同时还能搞定100万小时的机器人本体数据。到时候京东就能变成全球最大的具身智能数据公司了，直接从源头去破解行业里的“数据荒”。有了这么多数据撑着，“大脑”和“小脑”就能协同进化得更快。这么一来，京东做出来的具身模型不光是会“看”和“动”，更关键的是学会了怎么去“理解”这个真实的世界。