阿里发布千问旗舰推理模型参数规模突破万亿创新能力达国际先进水平

全球人工智能加速发展的背景下，我国科技企业推出了Qwen3-Max-Thinking模型，在三个关键领域取得突破。基础能力上，该模型采用超万亿参数架构，预训练数据量达36T Tokens，比行业平均水平高出约40%。通过独创的混合训练方法，模型数学推理测试中实现AIME与HMMT双项满分，这是国内模型首次达成该成就。中国科学院计算技术研究所研究员李明指出，这种大规模数据的成功应用为国内大模型研发提供了重要参考。推理效率上，研发团队首创了测试时扩展机制，能够对历史推理结果进行经验提炼，实现多轮自我迭代。相比传统方法，新机制相同计算资源下推理效率提升28%，在HLE工具调用测试中得分58.3分，超越国际主流产品。这种创新为降低大模型运营成本开辟了新路径。工具调用能力上，模型通过融合规则奖励与模型奖励的联合训练，实现了搜索、记忆管理、代码解释等功能的自主决策。在电商平台的压力测试中，模型完成复杂客服任务的准确率达92%，较前代提升15个百分点。阿里云智能首席科学家表示，该突破使大模型从"回答问题"升级到"解决问题"，为金融、医疗等专业领域应用奠定基础。目前，该技术已通过云服务平台向企业开放API接口，个人用户可通过多终端免费体验。市场分析机构预测，随着国产大模型商业化加速，明年我国智能计算市场规模有望突破2000亿元。，这次发布恰逢全球人工智能治理框架形成的关键期，我国在核心算法领域的突破将为国际规则制定贡献力量。

大模型发展正从单纯的参数竞赛转向价值交付；推理能力的提升只有与更低成本、更高可靠性和更强工具协同相结合，才能真正转化为生产力。对产业界来说，关键不在于追逐最新模型，而在于以实际应用场景为导向、以安全治理为基础、以工程体系为支撑，让技术进步稳妥地落地为可用、可控、可持续的应用。

阿里发布千问旗舰推理模型 参数规模突破万亿 创新能力达国际先进水平

阿里发布千问旗舰推理模型参数规模突破万亿创新能力达国际先进水平