阿里千问大模型核心负责人林俊旸:再见了,我亲爱的千问

3月3日这天,阿里巴巴干脆利落地把4款全新的千问3.5系列小模型给开源了。这其中最小的那款参数只有0.8B,另一款也才2B,体积小得跟个纽扣似的,跑起来特别快,特别适合装在手机或者IoT边缘设备上用。这几款模型虽然个头小,却自带多模态的功能,能用很少的计算量实现超强的表现。发布后没过多久,马斯克也在社交媒体上给它们点了个赞,夸它们“智能密度让人印象深刻”。 而到了3月4日下午,本来在那儿埋头干活的阿里千问大模型核心负责人林俊旸发了条朋友圈说,“今天不回消息不接电话了,我真的需要休息。qwen 的兄弟们,按照原来的安排继续干就行,没问题的。”他还在凌晨发了条说“me stepping down. bye my beloved qwen.(我卸任了。再见了,我亲爱的千问。)” 紧跟着这事发酵没多久,《科创板日报》记者就去查了下时间线。就在这4号凌晨,林俊旸已经在社交平台上跟千问道别,说“我退出了”。过了没一会儿,阿里巴巴通义实验室的科学家惠彬原(Binyuan Hui)也转发了这条博文并说自己也退出了。南都记者联系阿里云那边问这事呢,到现在还没给回复。 林俊旸算是千问模型的重要负责人之一。他是1993年出生的小伙子,北京大学毕业的。公开资料上看他是达摩院的高级算法专家、通义千问系列的技术负责人。他在自然语言处理和多模态表示学习这块儿研究得很深,也在顶级会议上发过好多论文。据公开信息说,他对千问技术贡献可不小。比如他带团队弄出的Qwen3.0性能就比Llama2-70B还要好;他还首创了多模态Agent框架;甚至帮着推动构建了中文社区最大的开源模型生态体系。 有业内人士猜他离职的原因可能跟考核目标变了有关。现在可能不看重技术实力了,而是盯着日活跃用户数(DAU)这一项指标。至于谁能接手他的位子,这位人士还提到了一个说法:没准是个从谷歌Gemini团队来的、专门盯着DAU指标的非核心人才。 林俊旸还跟月之暗面的CEO杨植麟、腾讯首席AI科学家姚顺雨和智谱的唐杰被合称为“基模四杰”,其他几位都是各自公司的模型掌门人。今年1月份他在中关村的时候还提过一件事:他2021年做模型的时候,阿里芯片团队的人跑来问他三年后模型主流架构会不会是Transformer和多模态。因为芯片做出来也得三年后才能流片。他当时就开玩笑说,“三年之后我还在不在阿里巴巴都不一定呢。但后来他果然还是用了Transformer和多模态,我就挺后悔当初没催他赶紧去做。”