科技·商业·财经

阿里携手英伟达布局Physical AI:从虚拟迈向现实,开启AI应用新篇章

   时间:2025-09-26 11:08 作者:冯璃月

在云栖大会上,阿里巴巴宣布了一项重要技术合作:将英伟达完整的Physical AI(物理AI)软件栈纳入其开发者生态体系。这一举措被业界视为人工智能发展从虚拟世界向物理世界跨越的关键转折点。英伟达首席执行官黄仁勋在2025年CES国际消费电子展上明确指出,物理AI将成为人工智能领域的下一个前沿方向,蕴含着巨大的商业价值和技术潜力。

市场研究数据显示,全球工业机器人市场正经历快速增长,预计2025年市场规模将达到3000亿美元,较2024年的1544亿元实现近一倍增长。其中,融合AI技术的工业机器人应用市场年复合增长率达21.9%,显示出强劲的发展势头。然而,当前大多数工业机器人仍属于传统自动化设备,依赖预设程序执行固定任务,在面对零件位置偏移或形状变化等动态环境时,需要人工介入重新编程。

物理AI技术的出现为这一难题提供了解决方案。与传统AI仅能识别物体不同,物理AI能够深入理解物体的物理属性,如重量、材质和运动规律,并据此做出精准的抓取力度计算和操作规划。这种技术突破使得机器人系统具备了自主适应环境变化的能力,为工业自动化带来了革命性变革。

物理AI的核心在于将物理规律与人工智能深度融合。通过整合真实世界的物理规则,AI生成的内容更加符合现实逻辑。英伟达自2021年起就在GTC技术大会上布局物理AI领域,经过多年技术积累,于2024年3月的GTC 2024大会上正式将其确立为核心战略,并推出了完整的技术平台和工具链。

在技术演进路径上,AI发展经历了三个阶段:最初是感知AI阶段,以计算机视觉和语音识别为代表;随后进入生成式AI阶段,催生了ChatGPT、DALL-E等创新应用;如今正迈向物理AI时代,AI系统不仅能够理解世界,还能进行推理、规划和物理操作。物理AI的技术架构由三大关键组件构成:世界模型负责构建三维空间认知,物理仿真引擎处理复杂物理交互,具身智能控制器实现虚拟推理与物理执行的衔接。

从系统实现角度看,物理AI采用分层架构设计。感知层整合多模态传感器数据,认知层运行世界模型和物理仿真引擎,执行层负责运动规划和控制。这种架构需要强大的计算资源支持,单个物理AI系统可能需数百个GPU核心实时运行。英伟达为此开发了RTX PRO服务器和DGX Cloud平台,采用分布式计算架构满足计算需求。

英伟达同步构建了完整的技术生态系统,包括Omniverse仿真平台、Isaac机器人开发套件和Cosmos世界基础模型。通过仿真环境生成大规模训练数据,解决现实世界数据收集成本高的问题。针对仿真数据与现实环境的差异,英伟达正在研发仿真到现实的迁移技术,以缩小"现实差距"。

在应用前景方面,黄仁勋对物理AI的发展充满信心。他预测物理AI将推动超过50万亿美元的行业变革,影响1000万家工厂、20万个仓库,以及数十亿台人形机器人和15亿辆汽车。特别值得关注的是,自动驾驶汽车和人形机器人将成为两大高产量产品,前者已进入商业化阶段,后者则因其适应人类环境的能力而备受期待。

阿里巴巴选择此时引入英伟达物理AI技术栈,有着深层的战略考量。当前AI大模型主要应用于线上场景,而物理AI的技术突破为AI融入现实世界提供了可能。阿里云智能集团董事长兼CEO吴泳铭明确表示,生成式AI的真正价值在于改变物理世界。尽管阿里在开源模型方面成绩显著,通义千问已开源300多个模型,累计下载量超6亿次,但面对物理AI的发展趋势,仍需解决从二维理解向三维交互转型的挑战。

物理AI的发展需要与现有AI技术生态深度融合。大语言模型提供语言理解和推理能力,计算机视觉技术实现环境感知,机器人技术完成物理执行,而物理AI则将这些能力整合为可在现实世界中运行的智能系统。在技术实现上,云边协同架构成为关键,复杂推理在云端完成,实时控制在边缘设备执行,既保证了计算能力又满足了实时性要求。

尽管物理AI前景广阔,但其发展仍面临诸多挑战。技术层面需要解决在复杂物理环境中的稳定性问题,降低计算成本以实现普及应用。仿真训练与现实应用之间的差异仍是待攻克的难题,如何确保仿真数据在现实世界中的有效性需要持续创新。这些挑战的解决将决定物理AI能否从技术概念转化为改变行业的实际应用。

 
 
更多>同类内容
全站最新
热门内容