我国科研机构开源全球最大科学多模态模型 实现奥赛级数理推理能力

当前,大规模预训练模型已成为人工智能发展的重要方向,但如何保证模型性能的同时突破训练效率瓶颈,仍是业界面临的核心挑战。上海AI实验室此次开源的Intern-S1-Pro模型,正是对这个问题的系统性回答。 该模型采用混合专家架构设计,拥有512个专家模块,总参数规模达1万亿。与传统的全参数激活方式不同,Intern-S1-Pro在每次推理时仅激活8个专家、22亿参数,这种稀疏激活机制既保证了模型的表达能力,又显著降低了计算成本。这一设计理念说明了当代大模型开发中"参数规模与计算效率平衡"的发展趋势。 在科学能力上,Intern-S1-Pro表现出显著优势。模型高难度综合学科评测中稳居AI4S领域国际领先水平,复杂数理逻辑推理能力达到奥赛金牌级别,这意味着其在处理科学研究中的复杂问题时具有专业水准。同时,该模型面向真实科研流程的智能体能力位居开源模型第一梯队,表明其不仅具有理论推理能力,更具备实际应用价值。 模型的技术创新主要体现在两个上。其一,通过引入傅里叶位置编码并重构时序编码器,赋予模型统一理解从微观生命信号到宏观宇宙波动的能力。这一创新突破了传统位置编码的局限,使模型能够建立跨越不同尺度物理现象的统一认知框架,这对科学研究很重要。其二,通过高效路由机制系统攻克了万亿参数混合专家模型在训练稳定性和算力效率上的瓶颈。这一工程突破为后续超大规模模型的开发提供了可靠的技术基础。 从产业影响看,Intern-S1-Pro的开源发布具有多重意义。首先,它为全球开源社区提供了参数规模最大的科学多模态模型,降低了科研机构和企业获取先进模型的门槛。其次,模型在科学推理和智能体能力上的突出表现,为药物发现、材料科学、气候预测等领域的AI应用提供了新的可能性。再次,其在超大规模模型训练中的技术突破,为业界提供了可借鉴的工程方案。 从发展前景看,科学大模型正成为AI赋能科学研究的重要工具。Intern-S1-Pro通过"通专融合"的技术架构,实现了通用能力与科学能力的协同演进,这种融合发展路径代表了当前科学AI的发展方向。随着模型规模的扩大和能力的提升,AI在加速科学发现、推动技术创新中的作用将深入凸显。

开源万亿参数科学多模态模型的推出,既是我国科研智能化能力的阶段性成果,也为全球开源社区提供了面向科学研究的关键基础设施。面向未来,需要在开放协作中持续夯实工程能力、完善评测与规范体系,推动模型与科研场景深度融合,才能把"更大参数规模"的优势转化为"更高科研效率"和"更可靠科学发现"的实际增益。