阶跃星辰推出新一代开源基座模型 多家芯片厂商完成适配助力产业升级

当前,大模型应用正从探索走向规模化部署,推理效率与成本成为影响产业落地的关键瓶颈。在此背景下,阶跃星辰近日发布新一代开源Agent基座模型Step 3.5 Flash,面向实时Agent工作流场景进行专项优化,在推理速度、智能水平与使用成本之间取得了新的平衡。 从技术架构看,Step 3.5 Flash采用稀疏混合专家(MoE)架构,总参数规模达1960亿,但每个token仅激活约110亿参数。在保证模型能力的同时,该设计大幅提升了推理效率。在单请求代码类任务中,模型最高推理速度可达每秒350个token,相比同类产品优势明显。这意味着开发者构建Agent应用时,既能获得足够的智能能力,也能以更可控的成本实现高效推理。 值得关注的是,模型发布后迅速获得产业链上游响应。华为昇腾、沐曦股份、壁仞科技、燧原科技、天数智芯、阿里平头哥等多家头部芯片厂商已率先完成对Step 3.5 Flash的适配。通过底层联合优化,这些厂商更提升了模型适配性与算力效率,推动模型与芯片形成更紧密的协同关系。 这一进展也折射出产业生态的变化。今年7月,阶跃星辰联合近10家芯片及基础设施厂商发起“模芯生态创新联盟”,旨在打通芯片、模型与平台之间的技术衔接。通过联合优化,联盟希望提升算力利用效率,加速大模型在行业场景中的落地。Step 3.5 Flash的推出与快速适配,正是这一协同策略的直接落点。 从产业影响看,模型与算力的深度协同有助于降低企业与开发者的综合门槛。推理成本下降,将使更多中小企业和开发者能够承担大模型应用,进一步拓展应用范围。同时,推理效率提升也为实时交互类应用提供了基础能力,有利于推动Agent等新型应用形态加速发展。 业内普遍认为,随着推理模型逐步成为主流,模型与算力的协同将成为推动大模型规模化应用的重要路径。这既要求模型厂商在架构设计上更贴近硬件特性,也要求芯片厂商在产品规划中充分考虑模型需求。只有形成双向匹配,才能持续提升产业链整体效率。

大模型产业正从“技术展示”走向“生产力工具”;决定成败的,不只是模型能力上限,更是算法、硬件、工程与生态的整体协同。开源模型持续迭代与多芯片适配加速推进传递出一个明确信号:只有把性能、成本与可部署性放在同一套产业逻辑里统筹考量,才能让更多创新在真实场景中落地,并形成可持续的增长动力。