阶跃星辰推出新一代开源基座模型多家芯片厂商完成适配助力产业升级

当前，大模型应用正从探索走向规模化部署，推理效率与成本成为影响产业落地的关键瓶颈。在此背景下，阶跃星辰近日发布新一代开源Agent基座模型Step 3.5 Flash，面向实时Agent工作流场景进行专项优化，在推理速度、智能水平与使用成本之间取得了新的平衡。从技术架构看，Step 3.5 Flash采用稀疏混合专家（MoE）架构，总参数规模达1960亿，但每个token仅激活约110亿参数。在保证模型能力的同时，该设计大幅提升了推理效率。在单请求代码类任务中，模型最高推理速度可达每秒350个token，相比同类产品优势明显。这意味着开发者构建Agent应用时，既能获得足够的智能能力，也能以更可控的成本实现高效推理。值得关注的是，模型发布后迅速获得产业链上游响应。华为昇腾、沐曦股份、壁仞科技、燧原科技、天数智芯、阿里平头哥等多家头部芯片厂商已率先完成对Step 3.5 Flash的适配。通过底层联合优化，这些厂商更提升了模型适配性与算力效率，推动模型与芯片形成更紧密的协同关系。这一进展也折射出产业生态的变化。今年7月，阶跃星辰联合近10家芯片及基础设施厂商发起“模芯生态创新联盟”，旨在打通芯片、模型与平台之间的技术衔接。通过联合优化，联盟希望提升算力利用效率，加速大模型在行业场景中的落地。Step 3.5 Flash的推出与快速适配，正是这一协同策略的直接落点。从产业影响看，模型与算力的深度协同有助于降低企业与开发者的综合门槛。推理成本下降，将使更多中小企业和开发者能够承担大模型应用，进一步拓展应用范围。同时，推理效率提升也为实时交互类应用提供了基础能力，有利于推动Agent等新型应用形态加速发展。业内普遍认为，随着推理模型逐步成为主流，模型与算力的协同将成为推动大模型规模化应用的重要路径。这既要求模型厂商在架构设计上更贴近硬件特性，也要求芯片厂商在产品规划中充分考虑模型需求。只有形成双向匹配，才能持续提升产业链整体效率。

大模型产业正从“技术展示”走向“生产力工具”；决定成败的，不只是模型能力上限，更是算法、硬件、工程与生态的整体协同。开源模型持续迭代与多芯片适配加速推进传递出一个明确信号：只有把性能、成本与可部署性放在同一套产业逻辑里统筹考量，才能让更多创新在真实场景中落地，并形成可持续的增长动力。

阶跃星辰推出新一代开源基座模型 多家芯片厂商完成适配助力产业升级

阶跃星辰推出新一代开源基座模型多家芯片厂商完成适配助力产业升级