问题——高质量数据供给仍存“弱、小、散”短板。 在数字化转型加速的背景下,数据已成为关键生产要素。随着“人工智能+”深入制造、交通、医疗、金融、城市治理等领域,行业对高质量数据集的需求迅速增长。但在实践中,一些数据集建设仍存在体量偏小、标准不统一、分散重复、共享不足等问题,制约数据要素价值释放,也影响新技术应用的规模化落地。 原因——需求端快速扩张与供给端体系化能力不足并存。 一上,行业应用从“能用”走向“好用、可控、可复制”,对数据的准确性、时效性、完整性、可追溯性提出更高要求,数据标注、清洗、治理、合规等环节投入随之增加。另一方面,数据资源分散不同主体和系统之中,涉及权属边界、隐私保护、标准规范、流通规则等多重因素,单个机构难以形成规模效应,导致优质数据供给与应用创新之间出现结构性不匹配。 影响——既关系产业创新速度,也关系数据要素市场建设质量。 高质量数据集是技术研发、模型训练和行业应用的重要基础。若缺乏稳定、可交易、可复用的数据供给,一些行业应用可能长期停留在试点示范阶段,难以形成可持续的商业闭环;同时,数据要素市场若长期缺少“优质优价、按质付费”的价格信号,也会削弱各主体在数据治理、合规流通上的投入动力,影响数据资源从“沉睡”走向“流动”的效率。 对策——以组织化遴选、试点带动和市场化机制协同破题。 第九届数字中国建设峰会涉及的情况发布会上,国家发展改革委党组成员、国家数据局局长刘烈宏表示,国家数据局重视数据要素对创新发展的支撑作用,提出“发展到哪里,就把高质量数据集建设到哪里”的导向,并强调“人工智能+”推进到哪里,行业高质量数据集的建设与推广就要跟进到哪里。 针对高质量数据集建设分散的问题,相关上会同26个部门开展组织化遴选,确定72家高质量数据集建设链主单位、140个先行先试工作单位,并形成104个典型案例,推动构建链主带动、多方参与、联合攻关、共建共享的建设生态。通过链条化组织与案例牵引,旨在减少重复建设,提升标准统一性和可复用能力,形成可推广的路径与方法。 围绕数据标注此关键环节,国家数据局推动产业布局与制度供给同步推进:在成都、沈阳、合肥、长沙、海口、保定、大同7个城市部署数据标注先行先试任务,出台《关于促进数据标注产业高质量发展的实施意见》,遴选47个优秀案例,并组织7次供需对接活动,促进标注能力与行业需求更精准匹配。相关举措希望通过试点城市先行探索,带动标准、工具、人才与服务体系完善,提升数据标注的规模化、规范化和可控性。 同时,刘烈宏表示,将持续推动“为高质量数据付费”的市场共识,促进行业高质量数据集在数据交易所挂牌、上架、交易;支持数据流通服务平台、数据商等机构完善流通交易服务,鼓励探索多样化流通利用模式,促进供需有序对接,让高质量数据集在合规前提下更顺畅流通。这一安排聚焦数据要素市场建设的关键:通过明确“优质优价”的市场预期,形成可持续的投入与产出机制,推动数据更快从资源属性走向资产属性。 前景——以梯次布局创新试验区,推动“数据供给—流通—应用”闭环形成。 据介绍,下一步将面向科技创新能力强、发展基础较好、产业特色突出的地区,聚焦“知识密集型”和“技术驱动型”方向,梯次布局一批技术先进、特色鲜明、赋能效率高的数据标注产业创新试验区。业内普遍认为,随着试验区建设推进、交易机制逐步完善、合规规则更加清晰,高质量数据集有望在更多行业形成可复制的供给体系与应用闭环,带动数据服务、标注工具、治理软件、隐私计算等相关产业协同发展,为数字经济提供更稳固的基础支撑。
在全球数字经济竞争格局加速重塑的背景下,我国系统推进数据要素市场化配置改革,将为实体经济数字化转型提供持续动力。随着技术、制度与模式的协同演进,这场变革有望深入释放数据要素价值,并对数字经济时代的生产方式与产业组织形态带来深远影响。