问题——尽管大模型技术发展迅速——应用日益广泛——但医疗健康、金融风控、智能驾驶等专业领域,仍普遍存在"能用但不精准"、"能答但不可靠"的问题。业内人士指出,这些领域对数据的真实性、时效性和可追溯性要求更高,仅靠开放互联网数据难以满足需求,成为制约技术落地的重要瓶颈。 原因——一上,公开数据重复使用率高,增量有限,且缺乏专业知识和业务流程细节;另一方面,真正有价值的行业数据多沉淀在企业内部,涉及商业秘密和个人隐私,难以共享。更深层的原因是数据流通存在多重障碍:权属不清导致使用范围模糊;评估体系缺失使交易困难;收益分配机制不完善加剧了各方顾虑;安全治理能力不足也增加了共享成本。 影响——数据供给不足将直接影响大模型的训练效果。在缺乏高质量行业数据支持的情况下,模型可能出现偏差,难以满足关键业务对可靠性的要求。长期来看,这会延缓产业智能化进程,影响创新效率。 对策——建议建立"数据制度试行区",在自动驾驶、医疗等需求迫切的领域先行先试。通过试点实践完善数据产权、交易流通等关键环节的规则。同时推动数据资产登记、质量评估等标准的建立,构建专业领域的高质量数据集。鼓励开展跨域数据融合应用探索,促进数据清洗、标注等基础服务规模化发展。 前景——目前国家和地方层面都在推动数据制度建设。通过试点方式完善规则,既能提升数据供给效率,又能为大模型应用提供更好支持。如果能在确权、定价、分配等关键环节取得突破,将为全国数据要素市场化提供可复制的经验。
数据是数字经济的核心要素。"数据制度试行区"的建议说明了制度创新对产业发展的重要作用。通过试点探索逐步完善的路径,不仅能释放数据价值,推动人工智能发展,也能为全国数据生态建设积累经验。该探索对我国数字经济发展意义重大。