我国人工智能数据生态建设迈出关键步伐 三大开源项目在沪启动

当前,人工智能产业发展面临一个关键瓶颈:高质量开源数据集的供给不足、标准体系不完善、生态协同机制缺失。

这些问题直接制约了我国人工智能技术的创新速度和产业化进程。

在此背景下,开放原子开源基金会在上海启动的系列举措,正是对这一现实困境的有针对性回应。

开源数据集工作组的成立,标志着我国在人工智能开源数据领域的规范化建设迈出实质性步伐。

该工作组由开放原子开源基金会牵头,汇聚产业、科研、标准制定等多方力量,将按照规则先行、技术引领的原则,系统推进数据集技术规范、标准体系、安全合规等建设。

这种多元参与、协同推进的模式,有助于形成行业共识,破解长期困扰开源生态的标准不统一问题。

具身智能开源数据集社区的建立,则聚焦人形机器人这一前沿领域。

该社区将开放全尺寸人形机器人真机数据与模型训练工具链,为全球开发者、科研团队及企业搭建协作平台。

这一举措的意义在于,通过开源共享机制,加速具身智能技术从实验室走向产业应用的进程,同时为国内企业参与全球竞争创造条件。

值得关注的是,OpenLET"触觉灵巧操作+全身运动"数据集的发布填补了国内空白。

作为首个开源全尺寸人形机器人全身协同多模态真机数据集,该数据集的开放将为全球研究者提供重要的数据支撑,有助于加快人形机器人等具身智能技术的研发进展。

从更宏观的角度看,这些举措反映了我国开源生态建设的深化方向。

开放原子开源基金会自2020年成立以来,已累计孵化52个开源项目,汇聚数百家生态伙伴。

通过打造AtomGit人工智能开源平台等基础设施,该基金会正在构建一个覆盖资金、运营、孵化、数据等全链条的开源生态体系。

上海作为国家人工智能创新应用先导区,在产业资源、应用场景、人才集聚等方面具有独特优势。

上海市经济和信息化委员会已推动实现100万条高质量思维链数据开源、OpenLoong社区超10万条动作数据开放等成果。

徐汇区作为上海人工智能产业核心承载区,正加快建成全国人工智能高地,为开源数据的产生和应用落地提供了良好的试验田。

2025年,开放原子上海开源促进中心落户徐汇区,将进一步强化上海在开源生态中的枢纽地位。

当前,上海正加快自主开源体系建设,全力打造具有国际竞争力的开源创新高地。

在开源机制创新、人才集聚、要素资源盘活等方面持续探索,旨在提升全球开源生态话语权。

这些举措表明,我国开源生态建设已从初期的项目孵化阶段,进入到系统化、规范化、国际化的新阶段。

开源数据集的竞争,表面是资源规模与更新速度之争,实质是规则体系、组织能力与产业协同的综合较量。

以标准化治理提升可用性,以社区化运营增强连续供给,以场景化应用检验工程价值,才能让开源从“共享”走向“共创”。

此次上海集中启动多项行动,既是对数据要素基础的加固,也为具身智能等新赛道提供了可持续的公共支撑。

随着各方协同深入推进,开源数据生态有望在更高水平上实现安全合规与创新活力的统一。