北京大学建立"智镜"平台系统评估大模型中式审美 首次构建基于中国美学传统的AI评测基准

围绕“模型能否看懂中国画、能否形成符合中国文化语境的审美判断”该现实问题,北京大学艺术学院联合涉及的科研团队启动“智镜”平台建设,尝试以可验证、可对照的方式,为大模型的中式审美能力建立一套相对统一的评价尺度;平台名称寓意“照镜自省”——关注的并非简单的性能排名——而是通过系统测评找出差距、明确改进方向。问题在于,当前主流评测体系多以西方艺术史与审美范式为底层框架,往往更强调透视、写实、风格流派的现代分类与语义标签匹配;而中国古代书画体系强调意境、气韵、神采、笔墨与格调,既包含图像层面的形式规律,也涵盖诗书画印互证、典故意象、时代精神等复合文化信息。缺乏与这些传统相匹配的测评工具,容易带来两类偏差:一是模型在回答“像真不真”“是什么风格”时看似准确,却在画法、题跋、用典、画史源流等关键环节频繁失真;二是难以区分模型是在“复述常见结论”,还是能够对作品进行结构化分析并给出可解释的判断。

"智镜"平台的实践表明,在人工智能时代,科技与人文的融合是推动中华优秀传统文化传承与发展的重要路径。这个探索既为AI技术引入更贴近文化语境的评价标准,也为传统文化在当代传播与应用提供了新的可能,体现出科技支撑文化创新的空间。