人工智能的发展轨迹正经历深刻转变。过去数年,以大语言模型为核心的数字智能占据主流,各类AI应用在虚拟空间中不断突破边界。如今,行业焦点开始转向能够直接作用于物理世界的智能系统,一场关于"物理AI"的竞争正在全球范围内展开。
科技巨头们已在这条新赛道上展开布局。英伟达推出的全模态物理AI模型NVIDIA Cosmos 3,配合其机器人技术全家桶,试图构建完整的物理世界交互体系。特斯拉则通过FSD自动驾驶系统的持续进化,以及Optimus人形机器人的迭代开发,展现其将AI能力延伸至现实场景的野心。这些动向表明,理解并影响物理世界的能力,正在成为AI发展的新标杆。
在众多物理AI应用场景中,自动驾驶技术展现出独特的优势。这个领域不仅需要处理海量物理数据,还能通过商业化运营形成持续的数据回流闭环。中国自动驾驶企业Momenta近期通过港交所聆讯,成为首个冲刺"物理AI第一股"的公司,其发展路径印证了自动驾驶作为核心赛道的战略价值。
Momenta构建的R7世界模型体系,代表了物理AI技术的重要突破。该模型通过三层架构实现物理规律理解与行动决策的融合:底层预训练阶段吸收120亿公里实车数据提炼的1亿段黄金场景,形成对物理世界的基础认知;中间仿真层利用生成式模型构建虚拟环境,支持对罕见场景的百万倍效率推演;顶层强化学习机制则通过虚拟试错,训练出最优决策能力。这种技术架构使系统能够像人类一样理解"推倒杯子会洒水"的物理因果关系。
技术突破带来的商业价值正在显现。Momenta已实现世界模型在量产车型中的首发应用,搭载其系统的车辆规模突破90万台,定点车型超过210款。这种规模化部署不仅验证了技术可行性,更形成独特的数据飞轮效应——真实道路场景产生的交互数据持续反哺模型进化,推动系统性能指数级提升。财务数据显示,该公司近三年营收从7.43亿元增长至24.13亿元,年均复合增长率超80%,现金储备突破100亿元。
物理AI的技术特性决定了其跨场景应用潜力。Momenta的基座模型架构已展现平台化特征,其技术能力同时覆盖乘用车、Robotaxi、Robovan等多个领域,并计划在2027年拓展至Robotruck市场。这种底层技术的复用模式显著降低了研发成本,据测算可使边际成本下降40%以上。更值得关注的是,从自动驾驶中锤炼出的"感知-物理理解-行动决策"能力链,具备向工业机器人、具身智能等更广泛领域迁移的可能性。
当前物理AI领域呈现多元化技术路线竞争的态势。以语言为中心的VLM、VLA模型试图将多模态能力映射到语言空间;像素中心的Sora类模型专注2D场景预测,但常出现违背物理规律的内容生成;三维结构导向的"空间智能"理念则致力于构建可交互的数字环境。这些探索共同指向一个核心命题:如何让AI真正理解物理世界的因果关系,并将这种理解转化为有效行动。
在自动驾驶这个物理AI的先锋领域,竞争格局正在加速固化。Momenta通过构建数据规模、技术架构、商业闭环的三重壁垒,已形成显著的先发优势。其客户群体涵盖奔驰、宝马、丰田等20余家全球主流车企,交付效率从最初的2年10万台提升至现在的40天10万台,展现出工程化能力的质变。这种规模效应与技术领先性的结合,正在重塑行业竞争规则。
资本市场对物理AI的价值重估已经启动。与传统AI公司估值逻辑不同,投资者开始关注企业构建物理世界交互基础设施的能力。Momenta的上市进程,实质上是世界模型技术首次接受公开市场检验。随着物理AI从技术概念走向规模化应用,能够定义下一代基础设施的平台型企业,或将主导这个万亿级市场的最终格局。






