国内首个具身智能开源数据集社区来啦!咱们把机器人的“大脑”看作是它能干活的关键,但现有的数据实在太少,高质量的真机数据更是少得可怜,这就导致它们在真实场景里表现总是磕磕绊绊。虽然合成数据和UMI数据在预训练时能提供大规模的优势,但真正能帮机器人跨越Sim2Real鸿沟的,还是真机数据。针对这个行业的痛点,近日上海交通大学、哈尔滨工业大学、同济大学还有乐聚机器人等共同组建了这个开源社区,旨在打通从采集到开源再到交易的整个链条,把具身智能的基础设施给搭建好。在这个社区里,他们把高质量的数据和工具链都开放了出来,大家一起共建共治,还能促进技术和产业的深度融合。以前大家都是各自为政地采集和训练数据,现在这个社区把这一切给统一起来了。 乐聚这次还拿出了OpenLET数据集系列来说事儿。这是全球首个把触觉灵巧操作跟全身运动给结合起来的数据集。他们在灵巧操作方面用了6×12×10的指尖压力矩阵触觉阵列数据,手腕处的六维力数据精度更是达到了±0.5%。全身运动这块儿也不含糊,覆盖了41个关节的精细控制信号。截止到现在,LET数据集系列在全平台的总下载量已经超过了100万次。这个系列涵盖了工业、商业和家庭三大领域,里面有117种原子技能,累计开源了超过60000分钟的时长。对于一个刚起步的产业来说,超百万次的下载量就像一次投票一样,开发者用实际行动告诉我们:真机数据现在真是太稀缺了,谁能拥有谁就更有可能在这个领域赢面大一些。 许丽思告诉我们说,数据基础设施正在重塑这个赛道的竞争逻辑。谁能更快拿到高质量真机数据、训练出会干活的“大脑”,谁就在下一阶段占据了先机。数据基础设施完善不完美,直接影响着具身智能产业的发展速度和天花板。