北京前瞻人工智能安全与治理研究院,在我国人工智能安全治理体系建设方面取得了重大进展,构建了一个多维度的评估平台,来应对技术发展过程中潜在的风险。随着全球人工智能技术的快速发展,技术安全和治理已经成为关系到发展主动权和国家安全的战略问题。最近,北京前瞻人工智能安全与治理研究院发布了一个新的前瞻性人工智能安全评估体系与基座平台,为我国应对人工智能风险提供了重要支持。这个平台把评估边界拓展到了具身智能安全、科学智能安全、社会安全、环境安全和灾难性风险五大领域。研究院院长曾毅介绍说,这个评估体系旨在服务教育科研、医疗健康、金融经济等关键领域,重点关注隐私保护和数据安全等挑战。 这次发布的“前瞻安全基准”评估体系,提供了一个立体化的安全评估框架。它没有只局限于网络安全和数据安全这些基础维度,而是把评估范围延伸到了具身智能、科学智能等新兴领域。这样设计是为了应对人工智能从纯软件算法向物理世界互动转变的趋势。曾毅强调,这个体系给不同行业带来了具体的操作规范。 作为技术支撑的“前瞻·灵御”平台则扮演着实战检验场的角色。它可以模拟真实场景下的对抗攻击,对大语言模型进行压力测试。这个平台支持对60多种主流大模型进行攻击和防御方法模拟验证。曾毅指出,测试结果显示有些新模型在面对针对性攻击时非常脆弱。“灵御”平台不仅能发现问题,还能提供解决方案。它证明了通过在推理阶段部署安全护栏就能有效抵御大多数攻击。 与“灵御”平台不同,“前瞻·灵度”平台关注的是伦理对齐和价值校准。这个平台可以在6个核心维度和90个细分类别下监测上百个大模型。它集成了中国价值观为核心的中文价值语料库,定义了超过25万条评估规则。曾毅强调这弥补了国际主流工具在中文语境下的不足。 北京前瞻人工智能安全与治理研究院这次发布的成果回应了关于评估、攻防和价值导向三大核心问题。这个系列成果代表了一种治理范式的创新,把安全和伦理要求嵌入到技术生命周期中。在全球竞争中构建自主可控的安全治理体系是维护国家利益和数字主权的必要要求。