在2026北京亦庄机器人半程马拉松赛事现场,一款名为“高德途途”的四足机器人吸引了全球目光。这款由阿里巴巴旗下高德地图研发的具身智能机器人,成功协助视障人士完成复杂避障、人群穿行等高难度任务,成为全球首款在开放环境中实现全自主运行的具身智能设备。其背后支撑的ABot全栈具身技术体系,以AGI(通用人工智能)为核心目标,通过数据引擎、基座模型与执行中枢的深度耦合,构建起“数据-模型-应用”三层飞轮式闭环系统,彻底打破了具身智能领域“实验室完美、落地困难”的行业困局。
ABot体系的核心优势在于其底层架构的重构。传统具身智能研发面临数据稀缺、仿真鸿沟、技能泛化三大痛点,而ABot通过将物理定律深度嵌入生成流程的可微分动力学引擎ABot-World,实现了虚拟训练与真实部署的无缝衔接。该引擎采用14BDiT架构,结合千万级真实数据与多层级采样治理,仅需稀疏输入即可生成厘米级高精度3D场景,大幅降低数据生成成本。在训练技术上,首创的Diffusion-DPO物理偏好对齐框架,通过构建优劣样本对驱动模型主动抑制违反物理规律的行为,使虚拟训练完全贴合真实世界规则。目前,ABot-World已累计生产万级3D真实场景、百万级推理数据与千万级训练轨迹,覆盖99%的典型生活场景,并在全球主流评测中成为唯一在物理合规性、动作可控性、零样本泛化三大维度均达SOTA的世界模型。
在模型层,ABot-N与ABot-M构成机器人的“运动双核”。ABot-N作为全球首个实现五大核心导航任务统一的VLA基座模型,采用层级式“大脑-动作”架构,通过多模块协同实现单一模型覆盖所有导航任务,在导航精度、社会合规性、零样本泛化能力上实现断层式领先。ABot-M则是全球首个统一架构的具身操作基座模型,首创动作流形学习技术,将学习目标由去噪重构转为流形投影,显著提升动作生成的稳定性与解码效率。两款模型累计斩获11项权威基准SOTA,并在LIBERO、RoboCasaGR1等主流操作评测中全面超越行业强基线,多项子成果入选ICLR、CVPR等全球AI顶会。
应用层的突破体现在ABot-Claw的“MapasMemory”(地图即记忆)理念。该执行中枢通过通用集中式Harness架构,将高德地图与用户私有地图设为全局认知锚点,把多模态感知数据统一映射至共享语义空间,形成可动态刷新、持久沉淀的“世界记忆”。新机器人终端接入后,仅需读取全局上下文即可零成本继承环境认知,彻底粉碎场景孤岛。同时,ABot-Claw采用“云端大脑—边缘响应”两级设计,支持多种异构机器人的并行协作与任务接力,实现任务上下文无缝移交与跨形态协同作业,标志着机器人系统从“单体智能”向“体系智能”的演进。
高德同步宣布开源ABot全栈技术体系,涵盖数据引擎、世界模型、导航模型、操作模型、执行中枢等核心技术。此举将直接降低行业技术研发门槛,推动具身智能从单点竞争走向生态协同。从四足机器人途途的开放场景落地,到ABot全栈体系的15项SOTA,再到全栈技术开源,高德以空间智能为核心优势,实现了从虚拟训练到真实部署、从单体执行到体系协同的全链路突破,为全球具身智能行业树立了新的技术标杆。












