我国人工智能数据生态建设迈出关键步伐三大开源项目在沪启动

当前，人工智能产业发展面临一个关键瓶颈：高质量开源数据集的供给不足、标准体系不完善、生态协同机制缺失。

这些问题直接制约了我国人工智能技术的创新速度和产业化进程。

在此背景下，开放原子开源基金会在上海启动的系列举措，正是对这一现实困境的有针对性回应。

开源数据集工作组的成立，标志着我国在人工智能开源数据领域的规范化建设迈出实质性步伐。

该工作组由开放原子开源基金会牵头，汇聚产业、科研、标准制定等多方力量，将按照规则先行、技术引领的原则，系统推进数据集技术规范、标准体系、安全合规等建设。

这种多元参与、协同推进的模式，有助于形成行业共识，破解长期困扰开源生态的标准不统一问题。

具身智能开源数据集社区的建立，则聚焦人形机器人这一前沿领域。

该社区将开放全尺寸人形机器人真机数据与模型训练工具链，为全球开发者、科研团队及企业搭建协作平台。

这一举措的意义在于，通过开源共享机制，加速具身智能技术从实验室走向产业应用的进程，同时为国内企业参与全球竞争创造条件。

值得关注的是，OpenLET"触觉灵巧操作+全身运动"数据集的发布填补了国内空白。

作为首个开源全尺寸人形机器人全身协同多模态真机数据集，该数据集的开放将为全球研究者提供重要的数据支撑，有助于加快人形机器人等具身智能技术的研发进展。

从更宏观的角度看，这些举措反映了我国开源生态建设的深化方向。

开放原子开源基金会自2020年成立以来，已累计孵化52个开源项目，汇聚数百家生态伙伴。

通过打造AtomGit人工智能开源平台等基础设施，该基金会正在构建一个覆盖资金、运营、孵化、数据等全链条的开源生态体系。

上海作为国家人工智能创新应用先导区，在产业资源、应用场景、人才集聚等方面具有独特优势。

上海市经济和信息化委员会已推动实现100万条高质量思维链数据开源、OpenLoong社区超10万条动作数据开放等成果。

徐汇区作为上海人工智能产业核心承载区，正加快建成全国人工智能高地，为开源数据的产生和应用落地提供了良好的试验田。

2025年，开放原子上海开源促进中心落户徐汇区，将进一步强化上海在开源生态中的枢纽地位。

当前，上海正加快自主开源体系建设，全力打造具有国际竞争力的开源创新高地。

在开源机制创新、人才集聚、要素资源盘活等方面持续探索，旨在提升全球开源生态话语权。

这些举措表明，我国开源生态建设已从初期的项目孵化阶段，进入到系统化、规范化、国际化的新阶段。

开源数据集的竞争，表面是资源规模与更新速度之争，实质是规则体系、组织能力与产业协同的综合较量。

以标准化治理提升可用性，以社区化运营增强连续供给，以场景化应用检验工程价值，才能让开源从“共享”走向“共创”。

此次上海集中启动多项行动，既是对数据要素基础的加固，也为具身智能等新赛道提供了可持续的公共支撑。

随着各方协同深入推进，开源数据生态有望在更高水平上实现安全合规与创新活力的统一。

我国人工智能数据生态建设迈出关键步伐 三大开源项目在沪启动