警惕人工智能数据污染新风险专家呼吁建立全链条监管机制

当前，生成式AI技术的快速发展为社会带来便利的同时，也衍生出新的风险隐患。

今年"3·15"晚会曝光的AI数据"投毒"现象，正是这一矛盾的集中体现。

所谓数据"投毒"，是指不法服务商利用生成式引擎优化技术，通过大量制造虚假信息并有针对性地"投喂"AI大模型，从而操纵其生成结果，使特定品牌或产品在AI推荐中获得不当优势。

这一现象并非孤立存在。

据媒体报道，相关服务商已形成完整的产业链，明码标价提供"优化"服务，报价从每季度数千元至数万元不等。

这种商业化运作模式表明，数据"投毒"已从个别现象演变为系统性问题。

追溯问题根源，AI大模型自身的运作机制存在明显脆弱性。

多数大模型在联网模式下，主要依赖第三方内容平台提供的信息摘要，对原始信息缺乏深度的语义理解和真实性验证。

在这种情况下，不法分子通过精心设计符合AI抓取习惯的内容结构，便能将虚假信息推送到更容易被采纳的位置。

更为严重的是，一旦虚假信息被AI反复引用和强化，就会形成难以清除的"数字污染"，其危害程度远超传统虚假广告。

与搜索引擎时代的信息操纵相比，AI"黑箱"特性使问题变得更加隐蔽复杂。

搜索引擎优化至少还有迹可循，而AI生成结果的决策过程往往不透明，即便是开发者也难以完全掌控。

这意味着虚假信息一旦进入模型训练数据，其影响范围和持续时间都将大幅扩大。

随着生成式AI技术的进一步普及应用，这类风险的潜在危害也在不断放大。

面对这一新挑战，现有的监管框架显然需要升级完善。

从平台层面看，AI大模型开发者应在信息检索、排序和结果呈现的各个环节建立更严格的广告识别和内容过滤机制，对疑似商业推广内容进行明确标注，强化信源质量核验。

同时，大模型应从多个独立且可信的信息源获取数据，避免单一信源偏见对生成结果的影响。

这需要开发者投入更多资源进行数据清洗、标注和内容审核，建立更加稳健的防护体系。

从监管层面看，相关部门需要制定针对生成式AI的专项规范，明确平台责任边界，建立有效的监督检查机制。

同时应加强对生成式引擎优化服务商的规范管理，防止其沦为数据"投毒"的工具。

此外，还需建立信息溯源机制，确保用户能够了解AI推荐内容的来源和可信度。

人工智能的价值在于提升效率，但效率不应建立在信息失真之上。

对“数据投毒”等新型风险，既不能因其隐蔽而放任，也不能因其复杂而畏难。

唯有以技术治理提升识别能力，以制度规则压实责任链条，以公开透明修复信任基础，才能让智能工具更好服务公众、赋能产业，并在规范有序的轨道上实现健康发展。

警惕人工智能数据污染新风险 专家呼吁建立全链条监管机制