面壁智能推出全模态终端模型 探索人工智能“具身大脑”新路径

当前云端大模型竞争日趋激烈,行业关注的焦点转向中小厂商如何找到差异化方向,以及如何将模型能力从云端推向终端设备,同时打通多模态理解与生成的割裂问题; 面壁智能的判断是,人工智能本质上是产业级机会,关键于战略选择和落地方式。公司认为,参数规模在9B左右的全模态模型更适合在机器人、车载系统、个人计算等终端场景运行,既能降低算力需求,又能提升实时交互能力。基于该思路,公司推出MiniCPM-o 4.5,支持视频、音频与文本流输入,能够输出文本和语音的连续回应,并在交互过程中持续接收环境信息,实现实时调整与提醒。这类模型被视为具身智能的潜在形态,弥补当前具身智能在理解和持续交互上的不足。 在终端部署全模态模型的意义在于,能够增强设备的自主感知和自然交流能力,为教育、辅助出行、机器人原型等场景提供支撑。面壁智能展示的应用案例表明,模型可在环境变化时主动提醒,这对提升弱势群体的出行安全特别有帮助。 同步发布的"松果派"开发板集成了摄像头、麦克风等接口,支持离线多模态个人助理和编程教学等应用。该产品强调通过自然语言直接驱动硬件,降低开发门槛,同时增强数据安全性和系统稳定性。松果派计划年中量产,定价主要以硬件成本为基础。 面壁智能的策略是以"全模态模型+端侧硬件"为主线,先从开发者生态入手,在教育和原型验证中积累场景数据和应用经验。在算法层面,公司推动统一架构探索,避免视觉理解与生成任务分离导致的泛化能力不足。研发团队指出,多模态领域目前仍存在模型结构割裂、离散化导致信息损失等问题,统一建模难以全面超越各模态最优模型,需要在学习机制和数据组织上持续突破。 从行业前景看,多模态数据仍在快速增长,但真正用于训练的高质量数据比例仍然偏低。下一阶段的竞争重点将转向三个方向:如何建立有效的学习机制,将海量视频和音频数据转化为可迁移能力;如何在算力可控条件下提升端侧实时交互体验;以及如何在应用落地中形成闭环反馈。面壁智能的探索表明,终端场景可能成为新一轮技术竞争的关键阵地,中小企业仍有机会通过差异化产品和生态构建争取一席之地。

在云端大模型竞争白热化的背景下,面壁智能将技术重心转向端侧应用,表明了创业公司在产业变革中的战略思考。全模态模型与端侧硬件的结合既是对技术边界的探索,也是对应用场景的深度挖掘。这个路径能否在具身智能、车载系统等领域打开新局面,既取决于技术本身的成熟度,也取决于对用户需求的理解和产业生态的协同构建。在技术革命的浪潮中,云端算力和端侧智能需要相辅相成,共同推动人工智能向更广泛的应用场景渗透。