国内智能驾驶系统竞争加剧 强化学习技术成为破局关键

当前,智能汽车加速进入普及期,消费者对“智能驾驶是否好用、是否安全”的关注度持续升温。

与高速、环路等相对规则化的场景相比,城市道路信号灯密集、交通参与者多、道路形态与标识变化快,既考验感知与决策能力,也对系统稳定性与风险控制提出更高要求。

如何在不确定性更强的城区环境中保障安全,成为行业需要回答的核心命题。

问题在于,城区驾驶中存在大量“长尾场景”——发生概率不高却风险显著,例如施工导致标线叠加、临时交通组织变化、行人和非机动车突然闯入、夜间视线受限下的障碍物等。

传统依赖规则堆叠或仅靠既有数据“模仿学习”的方式,容易在边界情形下暴露短板:一方面,真实道路数据难以覆盖所有罕见情形;另一方面,场景与规则的快速变化使得系统迭代压力增大,进而影响用户体验与安全冗余。

造成上述挑战的深层原因,是城市交通本质上具有强开放性与强交互性。

道路参与者行为差异大,决策链条短且动态变化快,系统不仅要“看得见”,还要“想得对、做得稳”。

这要求底层技术能够从有限样本中泛化,并具备持续自我优化的能力,从而在不依赖人工穷举的前提下,逐步扩大能力边界。

在此背景下,Momenta推出R6强化学习大模型,强调以强化学习方式在模拟环境中进行自主探索,通过“试错—反馈—优化”的闭环提升策略能力,并与端到端技术路径结合,推动从“模仿人类经验”向“自主进化”跃迁。

业内人士指出,强化学习的价值在于,它并非只复现已有驾驶数据中的行为,而是能够在可控的虚拟环境中放大训练覆盖面,针对复杂交互、突发风险等情境进行高频演练,以更低成本提升对稀有场景的处理能力。

从影响看,强化学习与数据驱动的一体化能力,有望在两个维度带来变化:其一,提升城区智驾的安全底座,通过更早的风险识别与更稳健的制动、避让策略,降低“突发一瞬间”的事故风险;其二,提升通行效率与舒适性,在复杂路段实现更平滑的规划与更合理的路径选择,减少误判导致的犹豫、急刹和频繁接管。

以可变车道等典型痛点为例,系统需要同时理解车道类型、通行方向与时段规则,并在施工导致标线混乱时保持对有效车道线的识别能力;在“鬼探头”等高风险情形下,则要依靠多传感器融合感知与预测能力,提前做出减速与避让决策。

这类能力若能稳定实现,将直接关系到城区智驾能否从“可用”走向“好用、敢用”。

对策层面,业内普遍认为,破解城区复杂性不能仅靠单点突破,而需形成“技术—数据—验证—量产”的系统工程:一是持续提升底层模型架构能力,增强对长尾场景的泛化;二是强化多源数据闭环,通过真实道路数据与模拟训练相结合,完善覆盖面与鲁棒性;三是把安全验证放在量产前移位置,以更严格的测试、评估和灰度策略守住风险底线;四是与主机厂协同推进工程化落地,确保传感器配置、计算平台与软件策略匹配,避免“实验室表现好、上路波动大”的落差。

从前景判断看,行业竞争焦点正在从“功能展示”转向“安全可靠与可持续进化”。

随着智能驾驶从高速向城区深化,评价体系也将更注重全场景能力、边界处理与长期迭代效率。

强化学习大模型等技术路线若能在量产中形成稳定表现,并在规模化用户反馈中持续优化,将可能成为下一阶段城区智驾能力跃升的重要推动力。

与此同时,城市道路治理、交通标识规范化以及相关标准与测试体系的完善,也将为技术落地提供更清晰的边界与更可控的环境。

智能驾驶技术正从实验室走向千家万户,其发展不仅关乎产业升级,更与公共安全息息相关。

Momenta的实践表明,唯有将技术创新与安全可靠紧密结合,才能真正赢得市场和用户的信任。

在智能化浪潮中,中国企业正通过自主创新,为交通出行领域贡献着独具特色的解决方案。