广东启动首届高质量数据集创新大赛 推动多领域数字化转型

近年来,数据作为关键生产要素的价值加快释放,但“数据多、好数据少”“能共享、难应用”“有场景、缺标准”等问题仍一定程度上制约产业升级与公共服务提质。高质量数据集是连接数据资源供给与应用落地的基础工程,其构建与规模化应用直接影响算法训练、行业模型迭代、智能化服务供给和治理能力现代化水平。基于此,广东启动首届高质量数据集创新大赛第一期赛事——面向多领域发布赛题——旨在通过竞赛机制汇聚创新主体、沉淀可复用的数据资产,推动数据要素市场化配置取得更实在的进展。 从原因看,一上,多行业数据长期分散不同主体和系统中,标准不统一、质量不稳定、更新不及时,难以形成可持续维护的“可用、可信、可流通”的数据产品;另一上,数据开发利用涉及合规、安全、授权、成本等多重约束,单靠个别单位难以短期内完成数据清洗治理、标注加工、场景验证并跑通应用闭环。通过设置面向重点领域的赛题,并分阶段组织评审与路演,有助于把真实业务需求、技术路线、合规要求与产业资源更紧密对接,降低试错成本,提高成果转化效率。 本期赛事聚焦能源、生物医药、金融服务、交通、医学检验、低空、教育创新、工业制造等领域,发布10个高质量数据集构建与应用赛题。赛事设置报名、初赛、复赛、路演四个阶段,报名时间为2026年1月1日至1月31日,比赛阶段为2026年2月1日至5月31日,对应的信息可通过官方网站http://www.gddatafair.com查询。参赛对象为广东省内依法注册的企业事业单位、科研院所、高校等独立法人单位。赛事支持牵头单位与省内外机构联合组队,鼓励产学研用一体化团队和跨领域协作团队参与,体现以开放协同促进数据要素价值释放的导向。 从影响看,竞赛机制有望带来三上效应:其一,带动数据治理能力提升。围绕赛题形成一批规范化、可持续维护的数据集产品,将推动数据采集、脱敏处理、质量评估、版本管理等环节更规范,形成可复制推广的实践路径。其二,加快重点行业数字化与智能化落地。面向能源调度、医药研发、金融风控、交通运行优化、教育资源供给等场景,数据集与应用方案结合,将促使算法模型更快进入实战,带动相关行业效率提升与服务优化。其三,促进产业链协同与创新生态形成。赛事鼓励联合组队,有利于促成数据资源方、技术提供方、场景应用方与投资机构对接,推动从“数据加工”走向“产品化运营”,探索更可持续的商业模式与协作网络。 对策层面,推动高质量数据集建设与应用,需要在“供给—流通—应用—治理”全链条协同发力。参赛单位一上应紧扣赛题导向,聚焦真实痛点与可落地场景,强化数据质量与可解释性,避免“重模型轻数据”或“重概念轻验证”;另一方面要严守安全合规底线,完善数据分类分级、授权使用、隐私保护、审计追踪等机制,做到可用与可控并重。主办方和相应机构可通过政策激励、人才支持、成果转化对接等方式,更打通从赛题发布到应用落地的闭环,推动优秀成果进入试点示范、行业推广和产业化孵化通道。 从前景判断看,随着各地加快建设数据基础制度和数据要素市场,高质量数据集将从“项目成果”逐步走向“基础设施”,成为行业模型训练与智能应用落地的重要公共能力。广东制造业基础扎实、应用场景丰富、创新主体集聚各上具备优势,通过赛事集中发布需求并汇聚供给,有望沉淀一批可推广的标准体系、工具链和应用样板,带动更多行业实现数据驱动的精细化治理与高质量发展。下一阶段,如何在确保安全合规前提下扩大数据供给、降低数据使用门槛、提升跨主体协同效率,将成为成果能否规模化复制的关键。

数据驱动创新,创新引领发展。广东首届高质量数据集创新大赛的启动,标志着该省在数据要素市场化改革中迈出新一步。通过该平台,广东将更汇聚各类创新力量,推动数据与产业深度融合,为建设数据强省、数字经济强省夯实支撑。有意向的企业、科研机构和高校可把握机遇,积极参与,在数据创新与应用落地中实现价值。