阿里发布首个原生语言世界模型Qwen-AgentWorld，推动通用智能体发展新路径

时间：2026-06-24 19:26 作者：互联网

阿里近日宣布推出其首个原生语言世界模型（LWM）Qwen-AgentWorld，该模型专为AI智能体的研发与训练设计，提供35B-A3B与397B-A17B两种参数规模版本。与传统模型不同，Qwen-AgentWorld的核心目标并非降低成本或替代真实交互环境，而是通过内部模拟环境反馈来增强智能体的决策能力，使其在执行动作前能够预判结果。

Qwen-AgentWorld的两大创新点在于：其一，从预训练阶段就将环境建模纳入训练目标，贯穿CPT→SFT→RL全流程，突破了传统模型先训练后适配环境的模式；其二，单一模型可同时覆盖文本类（MCP、Search、Terminal、SWE）与GUI类（Web、OS、Android）共7类环境，实现跨领域知识迁移。例如，该模型能模拟手机系统操作，通过预测点击删除图标后的界面变化，验证其环境理解能力。

为评估模型性能，阿里同步发布评测基准AgentWorldBench。该基准基于5个前沿模型在9个真实环境交互数据集上的表现构建，采用开放式评分标准，从格式、事实性、一致性、真实性和质量五个维度综合评估。测试结果显示，397B-A17B版本以58.71分的整体均分超越GPT-5.4（58.25分）、Claude Opus 4.8与Gemini 3.1 Pro，尤其在Terminal和SWE领域表现突出，这得益于其对代码执行状态和工具API行为的精准模拟。35B-A3B版本通过三阶段训练流水线提升8.66分，性能超越Claude Sonnet 4.6。

进一步分析模型思维链发现，Qwen-AgentWorld涌现出三种独特推理模式：一是自我修正能力，模型通过“Wait!”信号触发中断，修正事实错误或视角偏差，129个轮次中平均每轮修正10.4次；二是信息泄漏防护机制，在搜索任务中，模型主动屏蔽无关查询与目标答案的关联，避免数据泄露；三是多步因果推理，例如预测“curl -s localhost:3000 | python3 -m json.tool”的输出时，模型需构建6步推理链，涵盖服务器状态、端口监听、工具行为等环节。

作为统一智能体基础模型，Qwen-AgentWorld的预训练能力可直接迁移至多轮智能体任务，覆盖七个基准测试集，且无需针对具体任务进行强化学习微调。这一特性验证了语言世界模型作为构建更强智能体基础的潜力，为突破真实环境交互的限制提供了新路径。目前，阿里已开源35B-A3B模型权重及AgentWorldBench评估基准，开发者可通过GitHub、ModelScope和Hugging Face平台获取资源。

更多>同类内容

豆包大模型2.1重磅发布：代码智能体等多能力升级，开启AI生产新纪元

06-24

HDC 2026上京东金融秀鸿蒙版新招：AI赋能、全链路盯盘与交互体验升级

06-24

2025 ChinaJoy规模盛大引关注，今年7月31日再启航与AI共赴数字娱乐盛宴

06-24

海尔旗下绿色能源科技公司于三明成立新企，聚焦新能源技术研发与服务

06-24

复星集团携手上海锐煦在共青城设立新创投合伙企业注册资本达2000万元

06-24

“1点点”奶茶就食品安全问题致歉涉事门店停业并启动全国门店稽核检查

06-24

抖音出手整治！《明星到我家》“临时婆婆”仿冒账号蹭热度被无限期封禁

06-24

云南夫妻食菌中毒输液时溜走，男子产生幻觉，竟把妻子错认成蛇一路追打

06-24

豆包专业版上线：让2亿用户轻松体验办公Agent的强大能力

06-24

豆包专业版携2.1 Pro模型登场，三级阶梯定价满足多元需求，持续赋能创作办公

06-24

内存市场增长周期延续，2027年下半年或迎价格波动与供需考验

06-24

东方锆业4连板股价创新高，深股通及机构游资合力净买入超5亿元

06-24

半导体设备景气上行：指数大涨超5%，ETF易方达连续4日获资金净流入

06-24

消费电子赛道获机构看好，中证消费电子主题指数收盘大涨超4%

06-24

国机精工6月24日大宗交易：714.8万股成交5亿元成交价与收盘价持平

06-24

点击查看更多 +

全站最新

360纳米Work亮相ISC大会，周鸿祎：让AI从“能答”到“能干”新跨越

Counterpoint预测：2026年GenAI手机占比升至45%，高端市场或成主导

豆包专业版正式上线：办公能力升级，阶梯定价68元起还有学生特惠

5.3米旗舰MPV如何破局停车难题？银河V900机场实测揭秘大车好停真相

石头科技6月23日股价下跌3.56% 主力资金净流出超五千万资金流向引关注

2026哔哩哔哩创作者生态：腰部达人崛起，AIGC赋能，品牌营销新路径

热门内容

本栏最新

网界 - 新财经新科技新未来 - 网界传媒旗下网站 - 中国 · 北京
合作咨询微信：netspread（注明:网界）
网界^®是本公司38类注册商标，是该商标的唯一持有者，未经授本公司授权，严禁使用。
Copyright © CNU 2012-2022 www.cnu.com.cn All rights reserved. 鲁ICP备2022032383号-6 鲁公网安备37010202700502号