qwen3.5-max-preview预览版亮相lm arena

阿里通义Qwen3.5-Max-Preview就在刚刚露脸了,登陆了这个全球大模型竞技场LM Arena。3月20号那天,消息传出来说,阿里千问大模型家又添新丁了。这一天,Qwen3.5-Max-Preview以预览版的身份,给大伙儿展示了一把。作为千问3.5系列里的头号种子,它在这平台上大显身手,最后拿到了1464分的总分。靠着这个成绩,阿里千问在LM Arena全球排行榜上冲到了第五名,同时也是中国公司里的第一名。 咱说句实在话,LM Arena是LMSYS这个国际开源机构办的,专门搞第三方评测。他们的规矩挺有意思,让模型互相匿名比武,还让全球的开发者来投票打分,最后看谁赢谁输。因为采用了这种开放式对战加人工评估的组合拳,所以这个榜单在业界挺受重视的。这次评测里,Qwen3.5-Max-Preview在那个没风格控制的单挑里成绩不赖,整体排第六。具体到数学能力这块,它是全球第五;处理专家级文本的本事,也排到了全球第十。这是千问3.5系列头一回以旗舰的身份去参加这种国际第三方的PK。 IT之家那边也注意到了个事儿:自打年初一过了年,阿里千问今年可没闲着,已经陆陆续续把Qwen3.5系列的好多款模型都开源了。参数从0.8B到397B不等,一共有八种尺寸的模型出来了。每个尺寸在同等参数下都跑出了领先的水平。像那个Qwen3.5-Plus吧,就用了3970亿的总参数和170亿的激活参数设计。就靠着这个小激活参数的架构,它愣是干过了不少参数更大的模型。这次亮相的Qwen3.5-Max-Preview就是旗舰版本的预览版了,以后还会根据大家的反馈不停打磨优化。