上海再添开源基座模型新成果：Step 3.5 Flash发布并完成多家国产芯片适配

当前，人工智能应用正从单纯的对话交互向智能体方向演进，此转变为大模型的设计和优化提出了新的挑战。随着智能体应用场景日益复杂，底层模型虽然能力强劲，但规模化部署中面临响应延迟高、成本控制难、稳定性不足等问题，成为制约企业级应用落地的关键瓶颈。为解决这一问题，阶跃星辰在新发布的Step 3.5 Flash模型中进行了针对性优化。该模型采用稀疏混合专家架构，总参数量达1960亿，在单请求代码类任务上的推理速度可达每秒350个词元，能够满足多步推理中的低延迟响应需求。通过混合专家架构的设计，每个词元的激活参数得以降低，在保证模型能力的同时，大幅提升了在复杂智能体工作流中的响应速度，实现了推理能力与运营效率的平衡。在性能表现上，新模型在国际多款主流智能体能力测试中成绩突出，特别是在智能体场景和数学任务上显示出较强竞争力，已具备支持企业级应用落地的能力。这意味着该模型不仅在技术指标上达到先进水平，更重要的是具备了实际应用价值。值得关注的是，新模型发布即实现了与华为昇腾、沐曦股份、壁仞科技、燧原科技、天数智芯、阿里平头哥等多家头部国产芯片的适配。这一成果来自于阶跃星辰去年7月牵头发起的"模芯生态创新联盟"的推进。该联盟汇聚了近10家芯片及基础设施厂商，致力于打通芯片、模型与平台之间的技术壁垒，通过底层联合创新提升模型适配性和算力利用效率。从生态层面看，模型与芯片的协同适配正在从初期探索进入深化落地阶段。新模型与多款国产芯片的快速适配，表明国内芯片厂商的技术成熟度不断提升，同时也反映出模型开发者与芯片厂商之间的协作机制日益完善。这种协同不仅有利于提升国产芯片的利用效率，更为国内大模型产业链的自主可控奠定了基础。从产业发展角度看，模芯生态的完善对于降低企业应用成本、加速AI技术商业化很重要。通过提供更加高效、易用的大模型解决方案，可以让更多中小企业和开发者获得高质量的AI能力支持，推动AI应用的广泛普及。

中国人工智能产业正从单点突破转向生态共建。此次成果既展示了国产软硬件的技术实力，也凸显了开放合作对产业升级的重要性。面对全球化竞争，提升自主技术体系、构建更具韧性的产业链将成为未来发展的关键。