在新能源车企纷纷陷入同质化竞争的当下,理想汽车以一场别开生面的技术发布会,向行业抛出了关于智能汽车未来形态的全新命题。这场以“Livis Day”为主题的线下活动,没有新车发布,没有配置堆砌,而是将焦点对准了具身智能这一前沿领域,试图通过底层技术的重构,重新定义智能汽车的核心竞争力。
理想汽车董事长兼CEO李想在发布会上直言,当前行业对智能汽车的认知仍停留在“功能驱动”阶段。无论是软件定义硬件、联网在线,还是系统升级,这些传统要素已无法满足用户对真正智能体的期待。他提出,判断一辆车是否具备智能,需从安全、能力和效率三个维度重新审视:安全要超越人类极限,能力需覆盖全场景任务,效率则必须实现人机协同的质的飞跃。
基于这一理念,理想汽车将具身智能汽车定义为“四位一体”的复合体:它既是电动车,提供物理移动能力;又是职业司机,具备对道路、风险和规则的深度理解;同时是AI计算机,拥有超越旗舰智能设备的算力与内存;最终还要成为生活助手,通过自然交互完成用户指令。这种融合不是简单叠加,而是通过底层架构的统一,实现各模块的深度协同。
支撑这一愿景的是理想自研的三大核心模型。语言智能层面,云端部署的马赫Mind-Pro通过Token压缩技术,在任务完成率不变的前提下,将资源消耗降低38%,工具调用冗余减少47%;端侧的马赫Mind-Edge则采用多模态流式建模,能够实时理解动态物理世界,并直接输出动作指令调用车辆硬件。机器智能层面,升级后的马赫VLA系统通过数据、算力、模型规模的同步跃升,将危险反应时间缩短至0.28秒,较人类驾驶员提升近40%。更关键的是,理想重构了感知、预测、规划的模块化结构,将其统一为原生多模态MoE大模型,从根本上解决了传统架构中各模块意图不一致的痛点。
视觉感知方案的突破同样引人注目。面对行业对激光雷达线数的盲目追逐,理想提出了3D ViT模型,通过单目摄像头实现激光雷达级别的空间理解能力。研发团队解释,这一技术通过高维3D空间数据训练,使模型能够构建动态三维环境,即便在摄像头移动中也能保持精准定位。尽管如此,理想并未完全放弃激光雷达,而是将其定位为L3、L4场景下的安全兜底方案,同时利用其采集极端场景数据,持续提升系统鲁棒性。
所有模型的高效运行,离不开底层芯片的支持。理想自研的马赫M100芯片采用全球首个动态数据流架构,5nm制程下单颗算力达1280 TOPS。与传统冯诺依曼架构不同,该芯片砍掉了中央调度单元,让数据直接驱动计算发生,理论上可将AI模型性能释放提升至通用芯片的两倍以上。这一架构创新已获得学术认可,相关论文被ISCA 2026工业分区收录,成为汽车行业首例。
对于自研芯片的商业逻辑,理想算了一笔长远账:通过整车年销几十万台的规模效应,晶圆采购成本可充分摊薄;更重要的是,芯片与模型的深度耦合使算力利用率突破行业平均水平。配套自研的时空双维度数据流编译器,能够针对马赫VLA大模型优化,持续挖掘芯片潜在性能,逐步缩小与特斯拉FSD的体验差距。
这场技术变革的背后,是理想对行业趋势的深刻洞察。当竞争对手仍在屏幕尺寸、冰箱功率等表面配置上内卷时,理想已将战场升维至算力架构、多模态AI、整车软硬协同等底层领域。五年前启动的马赫芯片、VLA基座模型、Livis具身智能体系三大工程,如今正从实验室走向量产,构建起一条难以复制的技术护城河。
李想在发布会上强调,真正的具身智能汽车不应是冰冷的机器,而应具备“生命感”——它能主动感知风险、独立完成复杂任务,甚至在效率上超越人类驾驶员。这种理念下的产品,既保留了“冰箱彩电大沙发”带来的舒适体验,更赋予了车辆自主思考与行动的能力。当行业还在讨论配置清单时,理想已经用全栈自研的底层技术,为智能汽车的下一个十年写下了注脚。






