阿里发布千问旗舰推理模型Qwen3-Max-Thinking 多项评测刷新纪录并加速产业落地

阿里巴巴通义千问团队1月26日晚间正式发布新一代旗舰推理模型Qwen3-Max-Thinking,这是继去年9月发布Qwen3-Max基础模型后的又一重要升级。

新模型在多项国际权威基准测试中刷新纪录,性能与国际顶尖模型相当,代表了当前国内大模型技术的最高水平。

从技术规模看,Qwen3-Max-Thinking模型总参数超过万亿,预训练数据量达36T Tokens,是阿里迄今规模最大、能力最强的推理模型。

该模型基于更大规模的强化学习后训练,通过一系列推理技术创新实现了性能的显著提升。

在科学知识、数学推理、代码编程等多个关键领域的国际权威评测中,该模型均超越了GPT-5.2、Claude Opus 4.5和Gemini 3 Pro等国际顶尖模型,刷新了GPQA Diamond、IMO-AnswerBench、LiveCodeBench等多项全球纪录。

千问旗舰推理模型的突破性进展,不仅展现了我国科技企业的创新实力,也为人工智能技术发展提供了新的思路。

在全球科技竞争日趋激烈的背景下,持续加强基础研究、突破核心技术,是实现科技自立自强的必由之路。

这一成果的取得,标志着我国在人工智能领域正从"跟跑"向"并跑"乃至"领跑"转变,为数字经济发展注入新的动能。