阶跃星辰的大模型公司干了件挺硬气的事儿,把所有底牌都摊开了

3月4日,中国一家名叫阶跃星辰的大模型公司干了件挺硬气的事儿,把所有底牌都摊开了。你看,它不光把Step 3.5 Flash的整个模型都给开源了,还把里面的Agent基座Base、中训练权重Midtrain都给放了出来,甚至连专门的训练框架Steptron也一并交给了大家。这在现在的大环境下挺不容易的,毕竟很多公司都把开源当幌子,反而是阶跃星辰这次显得很实在,一下把整套东西都交了出去。 Step 3.5 Flash这货用了MoE架构,虽然总参数有1960亿看着挺吓人,但它在干活的时候特别聪明,只需要激活大约110亿个参数就行了。这样一来,在处理单请求代码任务时,它的速度能飙到350 TPS,这速度够快吧?而且它是专为智能体(Agent)场景设计的,不管是搞复杂推理还是处理长链任务,它都能挺住。官方也说了,在推理深度上,它完全能跟那些顶级的闭源模型拼一拼。 眼下像OpenClaw这种Agent平台的热度还在涨呢,这时候把Step 3.5 Flash拿出来开源,就相当于给中国的模型在全球的Agent生态里安了个大门。这下子搞智能体开发的人就更方便了,有了这些资源,中国模型要想在全球市场站住脚也容易多了。