国际研究团队实测显示：智能系统在高校理科考试中表现未达预期

近日，西北大学、加州大学圣克鲁兹分校、杜克大学、伯明翰大学、罗彻斯特大学等七所国际知名学府联合发布研究成果，对当前智能系统的实际能力进行了更贴近真实场景的检验。该研究于2026年2月发表在权威学术期刊上，首次使用真实大学课堂试卷而非人工编造题目，测试最新一代智能系统的学科理解与问题解决能力。研究结果显示，即便是最新发布的顶级智能模型，在真实的大学STEM课程考试中准确率也仅为59.69%，刚好达到及格线。此数据与公众对先进智能系统能力的普遍印象形成反差，提示从实验室指标到实际应用之间仍存在明显落差。

真实课堂的期末试卷之所以有分量，在于它检验的不只是知识点记忆，更考验推理链条的严密性与结果的可复现性。此次联合研究以“真题真考”提醒人们：技术进步值得期待，但教育场景更需要审慎与实证。把能力说清、把边界划明，才能让新工具在课堂中用得其所、用得安全、用得长远。