马斯克和特斯拉的ads，到底有多牛？

3月18日这天，李想在个人社交媒体上发了篇长文，来好好聊聊理想汽车刚发布的自动驾驶模型MINDVLA。这模型到底有多牛？咱得先说说马斯克和特斯拉的ADS。理想这次的突破跟特斯拉一样，不只是让车自己开，更是想把它变成一个通用的物理世界智能体。这就好比说，特斯拉的模型在车里能用，别的地方也行。为什么理想能这么搞？核心就是李想提到的那个三维视觉编码器，也就是原生3D VIT。以前的端到端模型为啥都得先搞2D训练再还原3D？主要是因为没做过3D预训练。但理想这次不一样，MindVLA-o1直接在3D环境里工作，压根就不需要还原这一步。有了这个本事，MindVLA-o1就把空间理解、思考推理和驾驶行为全塞进了一个模型里。不光能看见眼前的世界，还能在脑子里模拟未来几秒的变化。这种能力我们叫它多模态思考。李想还透露了个事：这一套基座模型不光是为了自动驾驶设计的。同一套VLA基座既能开车，也能控制机器人。说白了，它正在慢慢变成一个能在物理世界里到处跑的通用智能体。这事儿做得挺对路子。马斯克不是说过特斯拉的ADS是这样的嘛？新能源汽车现在智能驾驶这么火，希望国内品牌也都有自研能力，别光靠进口芯片或者国外现成的方案。咱也得有自己的智驾路线，这样才能给消费者提供更多更好的选择和体验。