阶跃星辰开源发布Step 3.5 Flash基座模型 多家芯片厂商完成适配助推应用落地

大模型应用正从探索阶段向规模化部署转变,推理效率与成本成为产业发展的关键制约。在此背景下,阶跃星辰日前发布了新一代开源Agent基座模型Step 3.5 Flash,针对实时Agent工作流场景进行了专项优化,在推理速度、智能水平与使用成本之间找到了新的平衡点。 从技术架构看,Step 3.5 Flash采用稀疏混合专家架构,总参数规模达1960亿,但每个token仅激活约110亿参数。这一设计在保持模型能力的同时,大幅提升了推理效率。在单请求代码类任务上,该模型推理速度最高可达每秒350个token,相比同类产品具有明显优势。这意味着开发者在构建Agent应用时,既能获得足够的智能水平,又能以更低的成本实现高效推理。 模型发布后迅速获得了产业链的广泛响应。华为昇腾、沐曦股份、壁仞科技、燧原科技、天数智芯、阿里平头哥等多家芯片厂商已率先完成对Step 3.5 Flash的适配。这些厂商通过底层联合创新,深入提升了模型的适配性和算力效率,形成了模型与芯片的良性互动。 这一现象反映了产业生态的深层变化。今年7月,阶跃星辰联合近10家芯片及基础设施厂商发起了"模芯生态创新联盟",旨在打通芯片、模型与平台之间的技术壁垒。通过联合优化,该联盟致力于提升算力利用效率,加速大模型在各行业场景中的应用落地。Step 3.5 Flash的推出与快速适配,正是这一生态协同战略的具体体现。 从产业影响看,模型与算力的深度协同有助于降低企业和开发者的应用门槛。推理成本的下降意味着更多中小企业和开发者能够负担大模型应用,这将进一步扩大大模型的应用范围。同时,推理效率提升也为实时交互类应用提供了技术基础,有利于推动Agent等新型应用形态的快速发展。 业内普遍认为,随着推理模型逐步成为主流,模型与算力的协同发展将成为推动大模型规模化应用的重要路径。这不仅要求模型厂商在架构设计上更加贴近硬件特性,也要求芯片厂商在产品开发中充分考虑模型需求。只有通过这种双向互动,才能实现整个产业链的效率最大化。

Step 3.5 Flash模型的发布是产业协同创新的生动实践;随着模型与算力协同发展的推进,人工智能技术有望在更多领域释放价值。这个案例也启示我们,突破性技术创新往往需要产业链各环节的紧密配合与共同努力。