马斯克和特斯拉的ads,到底有多牛?

3月18日这天,李想在个人社交媒体上发了篇长文,来好好聊聊理想汽车刚发布的自动驾驶模型MINDVLA。这模型到底有多牛?咱得先说说马斯克和特斯拉的ADS。理想这次的突破跟特斯拉一样,不只是让车自己开,更是想把它变成一个通用的物理世界智能体。这就好比说,特斯拉的模型在车里能用,别的地方也行。 为什么理想能这么搞?核心就是李想提到的那个三维视觉编码器,也就是原生3D VIT。以前的端到端模型为啥都得先搞2D训练再还原3D?主要是因为没做过3D预训练。但理想这次不一样,MindVLA-o1直接在3D环境里工作,压根就不需要还原这一步。 有了这个本事,MindVLA-o1就把空间理解、思考推理和驾驶行为全塞进了一个模型里。不光能看见眼前的世界,还能在脑子里模拟未来几秒的变化。这种能力我们叫它多模态思考。 李想还透露了个事:这一套基座模型不光是为了自动驾驶设计的。同一套VLA基座既能开车,也能控制机器人。说白了,它正在慢慢变成一个能在物理世界里到处跑的通用智能体。 这事儿做得挺对路子。马斯克不是说过特斯拉的ADS是这样的嘛?新能源汽车现在智能驾驶这么火,希望国内品牌也都有自研能力,别光靠进口芯片或者国外现成的方案。咱也得有自己的智驾路线,这样才能给消费者提供更多更好的选择和体验。