3月20日,阿里AI团队发布了Qwen3.5-Max-Preview预览版,这是林俊旸离职后千问系列的首次重大更新。这个模型迅速登上了全球大模型评测平台LMArena,获得1464分,挤进第一梯队。它不仅把千问实验室推到了全球前五的位置,还拿下国内第一的宝座。在没有样式控制的情况下,这个模型拿下1470分,排进全球第六。虽然在专家榜Arena Expert上它排在第十,但它已经超过了GPT-5.2-chat-latest和Gemini 3 Flash等一众模型。它的数学能力进了前五,文本能力也进了前十。与前代产品相比,Qwen3.5-Max-Preview在创意写作上提了57分,数学能力提了49分,娱乐、体育与媒体类任务提了48分,整体文本能力也提了45分。今年以来,阿里陆续放出了Qwen3.5系列的八个不同尺寸版本,参数规模从0.8B到397B不等。其中最大的Qwen3.5-Plus使用了约3970亿总参数和170亿激活参数,表现非常突出。这个预览版已经给了第一轮成绩,但真正的考验还在正式版。阿里这次把Qwen3.5-Max-Preview当成了验证模型层突破的第一张王牌。接下来正式版本发布后,大家都在等着看它能否再进一步。Claude和Gemini等竞争对手也在这个榜单上有不错的表现。Qwen3.5-Max-Preview把Claude Opus 4.5和Claude Sonnet 4.6给挤到了后面。这时候GPT-5.4、GPT-5.2-chat-latest还有Claude Sonnet 4.5 thinking版也都位列其中。值得注意的是Flash这个系列也在这里面。