mimo-v2-pro 正式亮相,支持长达1m的上下文长度

3月19日这天,小米大模型终于正式露面了,叫MiMo-V2-Pro。这个新的模型是专门给那些特别需要 Agent 干活的工作场景准备的,比如现实生活中那些特别繁重的任务。它的总参数量超过了1T,激活参数也有42B,用的是新的混合注意力架构,还能支持长达1M的上下文长度。现在这个模型的API服务已经开放了,能在256K上下文以内,输入收费是每百万tokens 1美元,输出是3美元;1M上下文以内的话,输入就变成了每百万tokens 2美元,输出是6美元。MiMo-V2-Pro已经同时在好几个平台上线了。这个更新后的版本就是给那些用Agent的人用的。