阿里发布千问旗舰推理模型Qwen3-Max-Thinking 多项评测刷新纪录并加速产业落地

阿里巴巴通义千问团队1月26日晚间正式发布新一代旗舰推理模型Qwen3-Max-Thinking，这是继去年9月发布Qwen3-Max基础模型后的又一重要升级。

新模型在多项国际权威基准测试中刷新纪录，性能与国际顶尖模型相当，代表了当前国内大模型技术的最高水平。

从技术规模看，Qwen3-Max-Thinking模型总参数超过万亿，预训练数据量达36T Tokens，是阿里迄今规模最大、能力最强的推理模型。

该模型基于更大规模的强化学习后训练，通过一系列推理技术创新实现了性能的显著提升。

在科学知识、数学推理、代码编程等多个关键领域的国际权威评测中，该模型均超越了GPT-5.2、Claude Opus 4.5和Gemini 3 Pro等国际顶尖模型，刷新了GPQA Diamond、IMO-AnswerBench、LiveCodeBench等多项全球纪录。

千问旗舰推理模型的突破性进展，不仅展现了我国科技企业的创新实力，也为人工智能技术发展提供了新的思路。

在全球科技竞争日趋激烈的背景下，持续加强基础研究、突破核心技术，是实现科技自立自强的必由之路。

这一成果的取得，标志着我国在人工智能领域正从"跟跑"向"并跑"乃至"领跑"转变，为数字经济发展注入新的动能。