理想汽车在GTC 2026发布MindVLA-o1基础模型以五项突破推动智能驾驶向立体感知与闭环学习演进

当前，智能驾驶正从“能用”走向“好用”，行业瓶颈也从单点功能实现，转向系统能力的稳定性和可规模复制性。城市道路要素复杂、长尾场景频发，同时车端算力与成本受限，如何守住安全边界的前提下提升泛化能力、降低研发与验证成本，成为共同难题。从技术演进看，传统自动驾驶方案在多传感器融合、决策预测、轨迹生成等环节已积累不少工程经验，但仍有三上不足：其一，对真实物理世界的三维理解不够，遮挡、光照变化、目标密集等场景中更容易误判；其二，对短时未来变化的刻画有限，遇到并线加塞、非机动车穿行等情况时，处置可能偏保守或反应滞后；其三，训练到部署链条偏长，实车测试成本高、迭代慢，影响量产节奏。针对这些问题，理想汽车会议期间发布的MindVLA-o1提出五项技术方向升级，意在将感知、预测、规划控制与工程部署打通，形成更紧密的闭环。在感知层面，MindVLA-o1强调三维空间理解能力建设。据介绍，该模型融合摄像头与激光雷达信息，并引入三维编码器，使车辆在识别目标类别的同时，更稳定地估计目标深度、距离与运动状态。业内人士认为，三维能力增强有望改善复杂道路结构、近距离交互和密集交通流下的定位与避障效果，为后续决策提供更可靠的输入。在决策层面，模型引入“隐世界模拟”思路，通过动态场景预测机制推演未来数秒的交通变化。核心在于将“看见什么”更扩展为“可能发生什么”，使系统在进入冲突区域前完成风险预判与策略选择。对于城市道路中常见的“突然变道”“行人探头”“非机动车横穿”等场景，这类预测能力被认为能提高决策的前瞻性与一致性，减少急刹、急打方向带来的不适与风险。在行为生成层面，MindVLA-o1采用多专家模块架构，面向不同驾驶任务调用相应“动作专家”，并以全轨迹点同步生成方式输出行驶路径，再通过优化过程抑制异常波动。公开信息显示，该方案在平顺性指标上有明显提升。业内分析认为，轨迹生成从“局部拟合”走向“全局协同”，有助于在拥堵跟车、环岛汇入、连续弯道等场景中保持驾驶风格稳定，减少不必要的频繁修正。在训练体系上，理想汽车提出闭环强化学习平台，借助高保真世界模拟器虚拟环境中进行大规模训练，以较低成本覆盖更多长尾场景，并加快验证与迭代。据介绍，相比实路测试，训练效率明显提高。行业普遍认为，虚拟训练与真实数据的有效结合将成为自动驾驶研发的重要方向：一上降低道路测试压力与成本，另一方面可控条件下复现高风险场景，提升模型对极端情况的处理能力。在工程化与硬件适配上，研发团队强调通过模型结构与车端芯片协同优化缩短部署周期，并通过动态匹配计算精度与硬件延迟提升车端运行效率。业界指出，车端部署能力直接关系量产可行性：只有在功耗与成本约束下实现稳定的实时计算，先进模型才能从实验室走向规模化产品，形成可持续的落地路径。综合来看，MindVLA-o1所体现的技术路线指向两个趋势：一是自动驾驶能力正从模块化堆叠转向基础模型驱动的系统化能力，更强调三维理解、预测推演与行为生成的一体化；二是“研发—训练—部署”链条加速闭环，虚实结合与芯片协同将成为量产竞争的关键变量。，业内也提醒，模型能力提升仍需在严格安全验证与法规框架下推进，尤其在复杂城市环境中，还需要长期数据积累与持续工程打磨，才能获得稳定、可解释、可复制的产品表现。

自动驾驶技术正在重塑未来出行；此次进展显示，中国企业已具备参与全球智能驾驶竞争的能力。在确保安全可靠的前提下，如何让技术创新与产业落地形成良性循环，将是推动交通智能化转型的关键。这既需要企业持续投入研发，也需要产业链协同以及政策法规的配套支持。

理想汽车在GTC 2026发布MindVLA-o1基础模型 以五项突破推动智能驾驶向立体感知与闭环学习演进

理想汽车在GTC 2026发布MindVLA-o1基础模型以五项突破推动智能驾驶向立体感知与闭环学习演进