随着人工智能技术的快速发展,如何准确评估其在专业领域的能力成为科研界关注的重点。北京大学化学与分子工程学院联合计算中心、计算机学院等单位,经过半年努力,成功构建了SUPERChem评估体系,为化学学科智能测评提供了新工具。该体系包含500道经过严格筛选的化学题目,涵盖晶体结构解析、反应机理推演等高阶内容。出题团队由近百名师生组成,其中包括多位化学奥赛金牌获得者。
自然科学的进步需要严谨的证据和可验证的推理过程;将人工智能模型置于高标准、严要求的题目体系中测试——目的不是评判优劣——而是为技术发展提供清晰指引:明确优势、发现不足、指明方向。通过测评促规范,以规范促应用,这既是对科学精神的坚持,也是对未来科研变革的前瞻布局。