在理想汽车近期举办的理想Livis Day活动上,公司展现了其在软件和具身智能领域的全面升级,将原本在L9 Livis上市发布会上应披露的技术细节单独呈现,引发行业关注。此次活动上,卖车不再是核心任务,自研芯片、新一代座舱、车载模型架构、全年OTA路线等成为展示重点。
活动次日,理想汽车CTO谢炎与基座模型负责人詹锟在媒体沟通会上,进一步阐释了芯片、模型及智驾路线等细节。理想汽车正通过一系列举措,逐步明晰其差异化突围路径。其中,“四季度赶上特斯拉FSD”的目标备受瞩目,理想的优势在于更高的整合效率,在相似组织规模下,最大程度打破“部门墙”,且团队成员合作紧密,技术边界分工被重新整合。
詹锟表示,这一目标的拆分体现在基础体验和能力方面。基础体验涵盖安全感、效率、舒适;能力方面则包括倒车礼让、极窄通行下的感知精准度等。由于芯片性能尚未完全释放,他对完成目标充满信心。数据作为自动驾驶的“燃料”同样重要,目前理想Livis版本的数据质量已达L4公司采集车队水平。谢炎强调,足够大的车队基数是前提,同时要重视“行为质量”,通过扩大车队规模和提升数据质量可有效抵抗模型提升带来的收敛作用衰减。
不过,理想的追赶并非线性路径。部分用户反馈L9 Livis体验中智驾体感变“肉”,如加速不够积极、博弈胆小等。谢炎称,下一个版本将改进加速逻辑,提升博弈能力和积极性,预计模型上限会有大幅提升。这表明,智驾需在“硅基家人”框架下实现更优质表现,平衡安全舒适性与智驾激进性是长期命题。
在智驾路线调整上,理想整体呈现向纯视觉靠拢、激光雷达并重的趋势。基于CVPR最佳论文的3D-VIT技术证明纯视觉可学习完整3D空间结构,是追赶特斯拉的关键。激光雷达则作为L3、L4的安全兜底,用于解决极端问题及更好采集数据。马赫M100芯片是理想“下半场”的核心,4年前立项,旨在降低成本并提升上限。若自研芯片无法超越外购,则无意义。
理想“上半场”为芯片“铺路”,谢炎认为自研芯片的基本条件是年营收千亿,才可能投入数亿研发。马赫M100最初目标为Orin X的4倍性能且成本更低,打破架构依赖是破局关键。目前,一颗马赫M100芯片已足够满足当下智驾需求,多出的一颗为下一阶段做准备。谢炎对马赫M100芯片竞争力高度自信。
在行业趋势判断上,理想认为在L3/L4阶段,全域软硬一体可避免冗余和高延迟,是领先企业摆脱同质化竞争、达到更高智能化标准的必然选择。当前技术未收敛期,垂直整合仍是核心竞争力。
沟通会上,谢炎还回应了诸多问题。对于理想芯片、基座模型和智能辅助驾驶整合成统一团队的差异化护城河,他表示与特斯拉出发点相同,需快速迭代和垂直整合。快速迭代要求团队紧密合作,垂直整合则避免在芯片和模型联合设计时失去创新机会。技术快速发展期,公司需打破技术边界分工进行整合,且组织规模小有利于合作紧密。
四年前,理想看到算力成本高且希望通过自研做得更好,因此决定自研芯片,目标为4倍Orin性能。为实现这一目标,理想抛弃英伟达技术路线,从第一性原理出发寻找机会。在组织协作上,理想以核心目标为中心构建项目团队,硬件、软件、模型团队共同分析,是一种软的合作机制。
谢炎指出,自研芯片需达到一定营收规模,车企年营收1000亿以上,研发投入至少10%才可支撑芯片研发。同时,研发芯片要能提升产品能力。芯片成本不仅与数量有关,还与面积相关,理想马赫M100立项时算过账,不会让公司效益变差。
对于理想称马赫M100为全世界性能最强AI芯片引发的讨论,谢炎表示与市面上标准可获得芯片对比,它是英伟达Thor-U三倍性能,可拿出Benchmark测试,且上车时间快,4年就上车并跑通所有模型。过程中虽有软件、编译、模型适配等困难,但理想不担心被复刻,因为架构落地有很长的距离和很多坑。
关于大算力芯片方案未做芯片级舱驾融合,而高通在低算力骁龙8650上做了这件事,谢炎认为舱和驾本质是两个独立系统,高端L3往L4走时,智驾需要更高确定性系统,资源不能实时切换,融合价值小;低端L2对切换实时性要求不高,有限共享也不多,真正的舱驾融合是资源物理上完全一块且可动态共享,目前还做不到,越往后走智驾越高端,舱驾融合意义可能不大。
詹锟介绍了马赫VLA,称其是一套技术体系,自动驾驶架构未来会把VLA和World Model整合在一起,一定有Language,但更本质的问题是马赫VLA是基于Language还是Vision。长远来看,基于Vision和Language原生的基础模型可能是趋势。
对于基座模型从车扩展到其他终端的问题,詹锟认为车和机器人差距大,车涵盖的具身交互、移动、操作等任务迁移到机器人有难度,虽有云端共同基座提供数据支持等,但基座不能直接用于任何任务。3DViT技术来自去年CVPR论文VGGT,证明2D视觉能学会完整3D空间结构,因对空间深度等理解能达到激光雷达级别效果,去年转入产品开发阶段,是纯视觉方案,不依赖激光雷达,在高帧率和极近处深度感知等方面有优势,是追上FSD V14的重要一环。






