阶跃星辰推理模型越来越主流了,模型和算力深度协同肯定是推动大模型落地的关键

就在2月2日那天,大模型界的新锐公司阶跃星辰把自家最新的开源基座模型给放出来了。这是个挺特别的 Agent 基座模型,名字叫 Step 3.5 Flash。官方给它的定位很清晰,主要就是给实时 Agent 干活的。别看它名字带“快”,其实不单是快,在智能水平和成本控制上也做得挺好。这就好比给 Agent 找到了个“搭子”,打算让大家都喜欢上它。Step 3.5 Flash 采用了稀疏 MoE 的架构,每处理一个 token 只激活大概 110 亿个参数,虽说模型总共有 1960 亿参数,但这样就能让它跑得飞快又稳当。 在处理单请求代码类任务的时候,Step 3.5 Flash 最高能跑到每秒 350 个 token 的推理速度。不仅速度快,它的成本也不高,特别适合企业和开发者去用。为了让这个模型更好地发挥作用,华为昇腾、沐曦股份、壁仞科技、燧原科技、天数智芯还有阿里平头哥这些芯片大厂都把适配工作给做完了。大家一块儿搞创新,把模型和算力捏合得更紧了。这对降低推理成本、让大模型更接地气肯定是好事。 之前南方+的记者叶丹也提到过这个模芯生态创新联盟。阶跃星辰在 2025 年 7 月的时候联合了十家芯片和基础设施厂商一起搞联盟,目的就是把芯片、模型和平台之间的道道打通。行业里都觉得现在推理模型越来越主流了,模型和算力深度协同肯定是推动大模型落地的关键路子。