问题:开源趋谨慎背景下,产业对高质量“可复现、可迭代”基础模型需求上升 近年来,大模型加速进入产业应用,智能体成为企业搭建自动化流程、协同知识工作的关键工具。但行业也面临一组现实矛盾:一方面,基础模型训练成本和门槛都很高,企业希望有可直接复用的开放底座;另一方面,受算力、数据与安全等因素影响,开源生态出现“只放模型、不放方法”“只放推理、不放训练”的谨慎趋势,开发者难以做深度定制与二次训练,进而影响落地效率与可控性。 原因:从“可用”走向“可训”,需要权重与框架的系统供给 阶跃星辰开源模型基础上,深入开放预训练权重(Base)、中训练权重(Midtrain)及训练框架Steptron,体现出将开源从“给结果”拓展到“给过程”的方向。一上,分阶段开放权重有助于研究者和企业更清楚地理解能力形成路径,降低从零训练的门槛;另一方面,开放配套训练框架,使开发者可以统一工程体系下复现实验、优化数据配方与训练策略,提高迭代效率。 该公司披露,Step3.5 Flash采用稀疏MoE架构,总参数约1960亿,但推理时仅激活约110亿参数,试图在能力与成本之间取得更好的平衡;在代码任务单请求场景下,推理速度最高可达350TPS,更贴近工程部署需求。模型面向智能体场景,强调复杂推理与长链任务处理能力,并在OpenClaw等公开评测榜单中进入前列。 影响:推动行业从“模型竞赛”转向“生态与工程能力竞赛” 业内人士认为,开源不止是发布权重,更关键在于能否形成可持续的开发者生态与工程化工具链。全链条开源可能带来三上影响:其一,提升技术扩散效率。Base与Midtrain权重可作为不同规模团队的训练起点,减少重复性的从零训练。其二,强化应用可控性。企业自有数据与规则约束下进行中训练或对齐调整,有助于提升行业场景的稳定性与一致性。其三,促进产业分工深化。底座模型、数据服务、行业应用与安全治理可在更清晰的接口上协同,推动创新从单点突破走向体系化推进。 此外,这也对社区提出更高要求:如何负责任地使用,如何在合规边界内共享数据与工具,以及如何建立更透明的评测与对比体系,仍需持续探索。 对策:以标准化工具链与可验证评测,提升开源“可用度”与“可信度” 面向产业落地,开源社区与企业可从三上着力:一是完善工程化支持,围绕训练、推理、部署、监控等环节提供更清晰的指引与范式,降低试错成本;二是强化评测与复现,鼓励公开数据集与公开流程下进行对比验证,减少“只报结论不报过程”的信息差;三是注重安全与合规,完善使用说明、风险提示与治理机制,推动形成可追溯、可审计的应用闭环。 对企业用户而言,应结合自身场景,优先在可控数据范围内进行分阶段训练与灰度验证,在性能、成本与风险之间做好平衡。 前景:智能体应用进入加速期,开放底座或成产业创新的重要杠杆 随着企业对自动化运营、知识管理与软件开发协同的需求增长,智能体有关应用预计将继续扩容。稀疏架构在降低推理成本上的优势,为“更强能力、更低消耗”的工程目标提供了可行路径;更彻底的开源策略,也有望在人才培养、技术迭代与产业扩散上带来更明显的带动效应。可以预期,未来竞争不只取决于参数规模或单项榜单成绩,更取决于工具链的完备程度、生态活跃度,以及在真实业务场景中的落地能力与持续迭代能力。
在全球科技竞争格局加速演变的背景下,如何在技术创新与开放共享之间取得平衡,考验企业的长期判断力。阶跃星辰此次的开源实践表明了其在人工智能领域的技术积累,也为行业提供了更可复现、可迭代的开放路径。面向未来,中国数字经济仍需要在自主创新与开放合作之间形成合力,在关键技术突破与产业生态建设上持续投入。