理想汽车在GTC 2026发布MindVLA-o1基础模型 以五项突破推动智能驾驶向立体感知与闭环学习演进

当前,智能驾驶正从“能用”走向“好用”,行业瓶颈也从单点功能实现,转向系统能力的稳定性和可规模复制性。城市道路要素复杂、长尾场景频发,同时车端算力与成本受限,如何守住安全边界的前提下提升泛化能力、降低研发与验证成本,成为共同难题。 从技术演进看,传统自动驾驶方案在多传感器融合、决策预测、轨迹生成等环节已积累不少工程经验,但仍有三上不足:其一,对真实物理世界的三维理解不够,遮挡、光照变化、目标密集等场景中更容易误判;其二,对短时未来变化的刻画有限,遇到并线加塞、非机动车穿行等情况时,处置可能偏保守或反应滞后;其三,训练到部署链条偏长,实车测试成本高、迭代慢,影响量产节奏。 针对这些问题,理想汽车会议期间发布的MindVLA-o1提出五项技术方向升级,意在将感知、预测、规划控制与工程部署打通,形成更紧密的闭环。 在感知层面,MindVLA-o1强调三维空间理解能力建设。据介绍,该模型融合摄像头与激光雷达信息,并引入三维编码器,使车辆在识别目标类别的同时,更稳定地估计目标深度、距离与运动状态。业内人士认为,三维能力增强有望改善复杂道路结构、近距离交互和密集交通流下的定位与避障效果,为后续决策提供更可靠的输入。 在决策层面,模型引入“隐世界模拟”思路,通过动态场景预测机制推演未来数秒的交通变化。核心在于将“看见什么”更扩展为“可能发生什么”,使系统在进入冲突区域前完成风险预判与策略选择。对于城市道路中常见的“突然变道”“行人探头”“非机动车横穿”等场景,这类预测能力被认为能提高决策的前瞻性与一致性,减少急刹、急打方向带来的不适与风险。 在行为生成层面,MindVLA-o1采用多专家模块架构,面向不同驾驶任务调用相应“动作专家”,并以全轨迹点同步生成方式输出行驶路径,再通过优化过程抑制异常波动。公开信息显示,该方案在平顺性指标上有明显提升。业内分析认为,轨迹生成从“局部拟合”走向“全局协同”,有助于在拥堵跟车、环岛汇入、连续弯道等场景中保持驾驶风格稳定,减少不必要的频繁修正。 在训练体系上,理想汽车提出闭环强化学习平台,借助高保真世界模拟器虚拟环境中进行大规模训练,以较低成本覆盖更多长尾场景,并加快验证与迭代。据介绍,相比实路测试,训练效率明显提高。行业普遍认为,虚拟训练与真实数据的有效结合将成为自动驾驶研发的重要方向:一上降低道路测试压力与成本,另一方面可控条件下复现高风险场景,提升模型对极端情况的处理能力。 在工程化与硬件适配上,研发团队强调通过模型结构与车端芯片协同优化缩短部署周期,并通过动态匹配计算精度与硬件延迟提升车端运行效率。业界指出,车端部署能力直接关系量产可行性:只有在功耗与成本约束下实现稳定的实时计算,先进模型才能从实验室走向规模化产品,形成可持续的落地路径。 综合来看,MindVLA-o1所体现的技术路线指向两个趋势:一是自动驾驶能力正从模块化堆叠转向基础模型驱动的系统化能力,更强调三维理解、预测推演与行为生成的一体化;二是“研发—训练—部署”链条加速闭环,虚实结合与芯片协同将成为量产竞争的关键变量。,业内也提醒,模型能力提升仍需在严格安全验证与法规框架下推进,尤其在复杂城市环境中,还需要长期数据积累与持续工程打磨,才能获得稳定、可解释、可复制的产品表现。

自动驾驶技术正在重塑未来出行;此次进展显示,中国企业已具备参与全球智能驾驶竞争的能力。在确保安全可靠的前提下,如何让技术创新与产业落地形成良性循环,将是推动交通智能化转型的关键。这既需要企业持续投入研发,也需要产业链协同以及政策法规的配套支持。