阶跃星辰开源发布Step 3.5 Flash基座模型多家芯片厂商完成适配助推应用落地

大模型应用正从探索阶段向规模化部署转变，推理效率与成本成为产业发展的关键制约。在此背景下，阶跃星辰日前发布了新一代开源Agent基座模型Step 3.5 Flash，针对实时Agent工作流场景进行了专项优化，在推理速度、智能水平与使用成本之间找到了新的平衡点。从技术架构看，Step 3.5 Flash采用稀疏混合专家架构，总参数规模达1960亿，但每个token仅激活约110亿参数。这一设计在保持模型能力的同时，大幅提升了推理效率。在单请求代码类任务上，该模型推理速度最高可达每秒350个token，相比同类产品具有明显优势。这意味着开发者在构建Agent应用时，既能获得足够的智能水平，又能以更低的成本实现高效推理。模型发布后迅速获得了产业链的广泛响应。华为昇腾、沐曦股份、壁仞科技、燧原科技、天数智芯、阿里平头哥等多家芯片厂商已率先完成对Step 3.5 Flash的适配。这些厂商通过底层联合创新，深入提升了模型的适配性和算力效率，形成了模型与芯片的良性互动。这一现象反映了产业生态的深层变化。今年7月，阶跃星辰联合近10家芯片及基础设施厂商发起了"模芯生态创新联盟"，旨在打通芯片、模型与平台之间的技术壁垒。通过联合优化，该联盟致力于提升算力利用效率，加速大模型在各行业场景中的应用落地。Step 3.5 Flash的推出与快速适配，正是这一生态协同战略的具体体现。从产业影响看，模型与算力的深度协同有助于降低企业和开发者的应用门槛。推理成本的下降意味着更多中小企业和开发者能够负担大模型应用，这将进一步扩大大模型的应用范围。同时，推理效率提升也为实时交互类应用提供了技术基础，有利于推动Agent等新型应用形态的快速发展。业内普遍认为，随着推理模型逐步成为主流，模型与算力的协同发展将成为推动大模型规模化应用的重要路径。这不仅要求模型厂商在架构设计上更加贴近硬件特性，也要求芯片厂商在产品开发中充分考虑模型需求。只有通过这种双向互动，才能实现整个产业链的效率最大化。

Step 3.5 Flash模型的发布是产业协同创新的生动实践；随着模型与算力协同发展的推进，人工智能技术有望在更多领域释放价值。这个案例也启示我们，突破性技术创新往往需要产业链各环节的紧密配合与共同努力。

阶跃星辰开源发布Step 3.5 Flash基座模型 多家芯片厂商完成适配助推应用落地

阶跃星辰开源发布Step 3.5 Flash基座模型多家芯片厂商完成适配助推应用落地