北京面壁智能发布9B参数端侧模型,全双工交互技术瞄准具身智能应用新赛道

人工智能快速演进的当下,如何让智能模型更高效地部署到终端,并实现更自然的交互,已成为行业关注的重点。面壁智能近期开源的MiniCPM-o 4.5模型,尝试从架构与模型效率两端给出新的解法。 技术突破上,该模型采用全双工交互架构,打破了传统单工模型“听”和“说”难以并行的限制。研发负责人介绍,模型的动态响应延迟低于200毫秒,并可根据环境变化自动判断更合适的交互时机。虽然其参数量仅为主流大模型的1%-4%,但借助高密度压缩技术,仍覆盖视觉理解、语音生成等全模态能力。 行业痛点推动了这个方向。具身智能领域,行业普遍面临“肢体强、大脑弱”的问题,机器人等终端设备往往缺少自然、顺畅的交互能力。清华大学智能技术专家指出,轻量化模型在终端部署上优势明显:既能降低硬件成本,也能提升响应速度。面壁智能提出的“密度法则”技术路线,核心在于持续提升单位参数的能力产出,为模型从“更大”转向“更高效”提供了思路。 市场前景上,该技术已在家用机器人、智能汽车等场景开展应用测试。某新能源汽车厂商技术负责人透露,搭载该模型的语音交互系统识别准确率提升15%,响应速度提高40%。业内分析认为,随着物联网设备对智能能力的需求快速增长,到2026年全球边缘侧智能模型市场规模有望突破千亿元。 政策层面也在持续加码。国家“十四五”智能制造发展规划提出,要重点突破嵌入式人工智能关键技术。工信部近期发布的《人形机器人创新发展指导意见》同样强调,需要加强环境感知、自主决策等核心技术攻关。

从追求参数规模到强调能力密度,从云端集中到端侧普及,从单向问答到全双工交互,技术路线的变化背后,是产业需求的深入升级。面向机器人、汽车与个人设备等真实场景,智能系统不仅要更聪明,也要更及时、更可靠、更易用。通过开源推动共创、以工程化加速落地,或将成为端侧智能走向规模化应用的重要一步。