当前,人工智能应用正从单纯的对话交互向智能体方向演进,此转变为大模型的设计和优化提出了新的挑战。随着智能体应用场景日益复杂,底层模型虽然能力强劲,但规模化部署中面临响应延迟高、成本控制难、稳定性不足等问题,成为制约企业级应用落地的关键瓶颈。 为解决这一问题,阶跃星辰在新发布的Step 3.5 Flash模型中进行了针对性优化。该模型采用稀疏混合专家架构,总参数量达1960亿,在单请求代码类任务上的推理速度可达每秒350个词元,能够满足多步推理中的低延迟响应需求。通过混合专家架构的设计,每个词元的激活参数得以降低,在保证模型能力的同时,大幅提升了在复杂智能体工作流中的响应速度,实现了推理能力与运营效率的平衡。 在性能表现上,新模型在国际多款主流智能体能力测试中成绩突出,特别是在智能体场景和数学任务上显示出较强竞争力,已具备支持企业级应用落地的能力。这意味着该模型不仅在技术指标上达到先进水平,更重要的是具备了实际应用价值。 值得关注的是,新模型发布即实现了与华为昇腾、沐曦股份、壁仞科技、燧原科技、天数智芯、阿里平头哥等多家头部国产芯片的适配。这一成果来自于阶跃星辰去年7月牵头发起的"模芯生态创新联盟"的推进。该联盟汇聚了近10家芯片及基础设施厂商,致力于打通芯片、模型与平台之间的技术壁垒,通过底层联合创新提升模型适配性和算力利用效率。 从生态层面看,模型与芯片的协同适配正在从初期探索进入深化落地阶段。新模型与多款国产芯片的快速适配,表明国内芯片厂商的技术成熟度不断提升,同时也反映出模型开发者与芯片厂商之间的协作机制日益完善。这种协同不仅有利于提升国产芯片的利用效率,更为国内大模型产业链的自主可控奠定了基础。 从产业发展角度看,模芯生态的完善对于降低企业应用成本、加速AI技术商业化很重要。通过提供更加高效、易用的大模型解决方案,可以让更多中小企业和开发者获得高质量的AI能力支持,推动AI应用的广泛普及。
中国人工智能产业正从单点突破转向生态共建。此次成果既展示了国产软硬件的技术实力,也凸显了开放合作对产业升级的重要性。面对全球化竞争,提升自主技术体系、构建更具韧性的产业链将成为未来发展的关键。