近日,阿里云通义实验室人事调整引发业界关注。
据了解,曾在谷歌DeepMind担任高级主任研究科学家的周浩已于今年1月正式加入阿里云,接替同期离职的郁博文,出任通义千问后训练负责人,直接向阿里云首席技术官、通义实验室负责人周靖人汇报。
这一人事变动被视为阿里云在大模型技术竞争中强化核心研发能力的重要举措。
周浩本科毕业于中国科学技术大学,2019年在威斯康星大学麦迪逊分校获得机器学习与计算机视觉博士学位。
此后,他先后在Meta从事基础研究,积累了大规模模型训练的工程经验,随后加入DeepMind并晋升至高级主任研究科学家,这一职级在谷歌研究体系中属于顶尖层级。
在DeepMind期间,周浩担任Gemini强化学习与自我改进团队负责人,深度参与了从Gemini 1.5到Gemini 3 Pro等旗舰模型的核心功能研发。
周浩的技术专长集中体现在两个关键领域。
其一是模型事实准确性保障。
在Gemini 1.0项目中,周浩担任应用层事实性联合负责人,其团队创新性地将事实准确性约束前置到模型训练阶段,通过设计专门的奖励函数和训练策略,使模型在生成过程中就能区分确定性知识与不确定推测,从源头减少虚假信息输出。
这一技术路径突破了传统事后检测的局限,显著降低了计算成本和响应延迟。
技术报告显示,Gemini Ultra在涵盖57个学科领域的MMLU基准测试中达到90.04%准确率,成为首个超越人类专家水平的模型,其在事实性相关任务上的表现被评价为"异常强劲"。
其二是多模态理解能力提升。
2024年,周浩作为核心贡献者参与的VideoPrism项目,构建了能够处理多类型视频内容的基础编码器,推动了模型从文本理解向视频等复杂模态的拓展。
这些技术积累为大模型在实际应用场景中的可靠性和泛化能力奠定了基础。
业内人士分析认为,周浩的加入将为通义千问带来多方面提升。
在事实准确性方面,其在Gemini项目中验证的训练方法论可直接应用于通义千问的后训练优化,有效降低模型幻觉现象,提升用户信任度。
在推理能力方面,强化学习技术能够增强模型的逻辑分析和多步骤推理能力,使其在复杂任务中表现更加稳健。
在多模态融合方面,视频理解等技术的引入将拓展通义千问的应用边界,支撑更丰富的交互场景。
当前,全球大模型竞争已进入技术深水区,单纯依靠参数规模扩张的路径面临边际效益递减。
如何提升模型的可靠性、可解释性和实用性,成为各家科技企业的核心课题。
阿里云此次引入具有顶尖工程化能力和理论创新经验的科学家,体现了其在技术路线上的战略判断——从追求性能指标向注重实际应用价值转变。
值得注意的是,周浩入职后采取了先挂靠夸克、再转入通义实验室的过渡路径,这一安排或与阿里内部组织架构调整及业务协同需求有关。
夸克作为阿里旗下智能搜索产品,其对信息准确性和用户体验的高要求,与周浩的技术专长高度契合,这段过渡期可能为其深入了解阿里业务生态提供了窗口。
从更宏观的视角看,周浩的加盟是中国科技企业吸引全球顶尖人才、提升自主创新能力的一个缩影。
近年来,随着国内大模型产业快速发展,越来越多具有国际一流研发经验的科学家选择回国或加入中国企业,这既反映了中国市场的吸引力,也体现了本土企业在技术投入和人才激励机制上的进步。
大模型竞争已进入“精工细作”阶段:拼的不只是更快迭代,更是对可靠性边界的敬畏、对工程闭环的打磨以及对真实场景的长期投入。
人才流动带来新的可能,但决定胜负的仍是体系能力的沉淀。
面向未来,能让模型在复杂任务中少犯错、可解释、可追溯,并真正服务生产生活的团队与产品,才能赢得更广泛的信任与更稳定的增长。