有个消息,3月4日,中国一家叫阶跃星辰的创业公司搞了个大动作,把他们的 Agent 基座模型的预训练权重(Base)、中训练权重(Midtrain),还有他们自己研发的 Steptron 训练框架全都给开源了。就在这之前,这家公司已经先把 Step 3.5 Flash 模型给开源了。这下可好了,大家都在讨论这个。现在这种大模型开源环境下,大家都挺保守的,这次把这么多东西都拿出来真的挺猛的。 这个 Step 3.5 Flash 模型是专为智能体(Agent)场景设计的,用的是稀疏 MoE 架构。虽说它有1960亿个参数,但是在推理的时候只需要激活约110亿个参数,所以速度特别快。在做代码任务的时候,单请求的推理速度最高能达到350 TPS。它在复杂推理和长链任务上表现得特别好。官方说这个模型的推理深度可以和一些顶级的闭源模型比一下。 最近像 OpenClaw 这样的 Agent 平台越来越火了。Step 3.5 Flash 的开源行动肯定会让中国模型在全球的 Agent 生态中渗透得更快。