在具身智能领域,WorldArena Track1(世界模型感知与动作响应赛道)的最新评测结果引发关注。智元自主研发的世界模型Genie Envisioner-Sim 2.0(简称“GE 2.0”)凭借综合优势,在该榜单中位列第一。这一赛道以具身智能的“认知与行动”能力为核心,被视为评估通用人形机器人智能化水平的关键指标。智元团队强调,GE 2.0未针对赛题进行专项优化,仅基于公开数据微调,其表现印证了模型的通用适配性。
根据技术报告,GE 2.0实现了从单一功能到全场景模拟器的跨越。相比前代,它不仅提升了单点性能,更构建了可试错、可迭代的虚拟环境,支持机器人策略在仿真场景中自主积累经验,降低真实场景的试错成本,最终实现从“感知预测”到“自主决策”的技术闭环。这一特性使其能够高效迁移至物理世界,为人形机器人的落地应用提供技术支撑。
在具体能力上,GE 2.0首次完整覆盖长时序生成、多视角生成、本体状态模拟、近实时推理及奖励判别等核心环节。例如,在长时序推理任务中,其画面质量随时间衰减的幅度显著低于行业基准。即使生成40-50秒的长视频片段,质量仍优于基线模型前10秒的表现,展现出极强的稳定性。
2026年被视为具身智能从实验室走向规模化部署的关键节点。随着机器人逐步进入真实场景,行业对算法的泛化能力和场景适应性提出了更高要求。世界模型作为连接虚拟与物理世界的桥梁,正成为技术突破的核心方向。今年以来,全球资本加速涌入这一领域,头部企业与科研机构纷纷布局。
国际市场上,2月,由“AI教母”李飞飞创立的World Labs完成10亿美元融资,英伟达与AMD首次联合投资;3月,杨立昆领衔的AMI Labs以10.3亿美元种子轮融资刷新欧洲AI领域纪录;4月,专注世界模型的极佳视界一个月内完成两轮共25亿元融资,并宣称成为国内首个相关领域的百亿独角兽。国内方面,4月披露的多起大额融资均聚焦具身智能核心赛道,涉及忆生科技、晨昏线科技、苏度科技等企业,资金流向涵盖大脑算法、世界模型及底层技术。
智元团队表示,未来将持续优化世界模拟器技术体系,推动具身智能技术闭环的完善。通过降低虚拟与现实场景的迁移门槛,GE 2.0有望为人形机器人的规模化应用提供更稳固的技术基础,助力行业突破落地瓶颈。






