北京大学建立"智镜"平台系统评估大模型中式审美首次构建基于中国美学传统的AI评测基准

围绕“模型能否看懂中国画、能否形成符合中国文化语境的审美判断”该现实问题，北京大学艺术学院联合涉及的科研团队启动“智镜”平台建设，尝试以可验证、可对照的方式，为大模型的中式审美能力建立一套相对统一的评价尺度；平台名称寓意“照镜自省”——关注的并非简单的性能排名——而是通过系统测评找出差距、明确改进方向。问题在于，当前主流评测体系多以西方艺术史与审美范式为底层框架，往往更强调透视、写实、风格流派的现代分类与语义标签匹配；而中国古代书画体系强调意境、气韵、神采、笔墨与格调，既包含图像层面的形式规律，也涵盖诗书画印互证、典故意象、时代精神等复合文化信息。缺乏与这些传统相匹配的测评工具，容易带来两类偏差：一是模型在回答“像真不真”“是什么风格”时看似准确，却在画法、题跋、用典、画史源流等关键环节频繁失真；二是难以区分模型是在“复述常见结论”，还是能够对作品进行结构化分析并给出可解释的判断。

"智镜"平台的实践表明，在人工智能时代，科技与人文的融合是推动中华优秀传统文化传承与发展的重要路径。这个探索既为AI技术引入更贴近文化语境的评价标准，也为传统文化在当代传播与应用提供了新的可能，体现出科技支撑文化创新的空间。

北京大学建立"智镜"平台系统评估大模型中式审美 首次构建基于中国美学传统的AI评测基准

北京大学建立"智镜"平台系统评估大模型中式审美首次构建基于中国美学传统的AI评测基准