腾讯元宝除夕夜生成辱骂内容引发关注 官方回应系统异常已启动整改

问题——节日场景下生成内容“失控”引发关注; 据媒体报道,西安一名市民为制作拜年图片下载并使用腾讯元宝应用。在多次调整生成指令后,他发现新生成的海报中,原本的“新年快乐,仕途顺遂”等祝福语被替换为带有侮辱性的低俗字句。用户称,此前未使用过该应用,下载是因为节日期间社交平台流行的“金色朋友圈”效果;操作过程中共发出约5次生成请求,未输入违禁词或刻意引导语,只是在对效果不满意时表达了“你这是设计的什么鬼”等情绪化评价。事发后,用户向平台反馈并留下联系方式。针对舆论关切,腾讯元宝官方账号在有关社交平台留言解释原因并致歉。 原因——多轮交互与安全策略叠加失效或是诱因。 从平台回应看,此次事件被认定为“模型在处理多轮对话时输出结果异常”。业内人士指出,面向公众开放的内容生成服务通常涉及指令理解、文本生成、模板渲染、敏感词拦截与语义安全评估等多个环节。若在多轮交互中出现语义误判、上下文关联偏移,或安全策略对脏词变体、谐音拆分、图文叠加等情况识别不足,都可能导致不当内容“漏出”。同时,节日期间用户集中涌入、使用场景高度相似,系统负载上升也可能放大边界问题,暴露出审核策略、容错机制与回退方案仍不够完善。 影响——损害用户体验与平台公信力,触发内容治理压力。 节日拜年海报属于强社交传播内容,一旦出现辱骂或低俗文字,不仅影响当事人体验,也可能在转发、截图传播中带来二次扩散风险,进而损害平台形象与公众信任。更重要的是,面向社会提供内容生成服务,安全与合规必须放在首位。此次事件也表明,在情绪化输入、口语化表达以及多轮追问等常见使用方式下,系统仍可能出现“越界表达”,对平台内容安全治理能力提出更高要求。 对策——紧急修正之外,更需机制化补强。 平台已表示完成紧急校正与优化,但从治理角度看,还需要更细化、常态化的补强措施:一是加强多轮对话的上下文边界管理与异常回退机制,当检测到输出偏离预期或触及风险阈值时,自动降级到安全模板或拒绝生成;二是提升对低俗辱骂变体、拆分字符、谐音及图文叠加场景的识别能力,完善“生成前拦截+生成后复核”的双重策略;三是优化用户申诉与处置闭环,做到快速响应、结果可追踪,必要时给予补偿与说明;四是加强透明度建设,定期披露安全优化进展与典型问题处置情况,用可验证的改进回应社会关切。 前景——内容生成服务将进入“安全能力竞争”阶段。 随着各类智能生成应用在社交、营销与政务便民等场景加速落地,公众对其可靠性、文明表达与未成年人保护等要求也在同步提升。可以预期,相关平台将继续在技术、管理与制度层面加码:算法层面更强调安全对齐与可控生成,运营层面更强调高风险场景的灰度发布与压力测试,治理层面更强调对投诉高发问题的专项整治。对行业而言,能否把“不出事”变成“可证明的安全”,将成为下一阶段竞争的关键。

随着技术不断走入生活细节,这场除夕夜的“意外插曲”也提示了一个现实问题——如何在效率与安全、创新与责任之间建立可持续的动态平衡,将成为技术、伦理与法律共同面对的长期课题。正如中国科学院院士张钹所言:“人工智能的成熟不仅体现在智商提升,更在于情商与责任感的同步进化。”