阿里千问Qwen-AgentWorld问世：原生语言世界建模，突破通用智能体能力边界

时间：2026-06-24 15:59 作者：快讯

阿里巴巴今日宣布推出全球首个原生语言世界模型Qwen-AgentWorld，该模型突破传统架构设计，通过单一架构同时支持文本交互环境与图形用户界面（GUI）环境的智能体模拟，覆盖搜索、终端操作、软件开发、网页浏览、操作系统交互及安卓应用等七大核心领域。官方同步发布配套评测基准AgentWorldBench，提供基于真实环境交互的验证数据集，相关模型与评测工具已开放下载。

区别于传统大语言模型的事后环境适配，Qwen-AgentWorld采用"环境建模优先"的训练范式，从持续预训练阶段即引入环境知识注入，通过"持续预训练（CPT）→监督微调（SFT）→强化学习（RL）"三阶段渐进式训练，构建起完整的世界建模能力。其中CPT阶段注入超千万条真实交互轨迹数据，SFT阶段强化状态预测推理能力，RL阶段通过环境反馈优化模拟真实性，最终形成350亿参数（35B-A3B）与3970亿参数（397B-A17B）双版本模型。

在技术实现层面，该模型创新性地将文本类环境（MCP协议交互、搜索引擎、终端命令行、代码编辑）与GUI类环境（网页操作、桌面系统、移动应用）统一于单一神经网络架构，通过跨领域知识共享机制实现能力迁移。例如在未接触过的安卓应用测试中，模型仍能基于网页操作经验完成基础任务，验证了其跨模态理解能力。这种设计显著降低了多场景智能体开发的复杂度，相关代码已在Hugging Face和ModelScope平台开源。

评测数据显示，3970亿参数版本在AgentWorldBench基准测试中取得全面领先，其整体模拟质量超越GPT-5.4、Claude Opus 4.8及Gemini 3.1 Pro等现有模型。特别在可控模拟强化学习场景中，该模型通过环境解耦设计实现行为塑造的精准控制，在Tool Decathlon工具使用、MCPMark协议交互等专项测试中，表现优于真实环境训练的智能体系统，验证了虚拟环境训练的有效性。

作为通用智能体基础模型，Qwen-AgentWorld展示了独特的迁移学习能力。经语言世界模型（LWM）预热训练的智能体，在七个基准测试中（含三个完全未接触过的领域）直接参与多轮任务评测，无需额外强化学习微调即取得优异成绩。这种能力突破了传统智能体依赖真实环境交互的训练边界，为构建更强大的自主智能系统提供了新范式。

配套发布的AgentWorldBench评测集包含七大领域的交互轨迹数据，每个样本均附带真实环境执行结果与观测数据。数据集采用JSONL格式按领域划分，既可用于模型性能评估，也可作为训练数据补充。该基准的推出填补了语言世界模型领域标准化评测的空白，为学术界与产业界提供了重要的研究基础设施。

更多>同类内容

多款App开屏广告悄然下架百度地图等提供关闭反馈新路径

06-24

通用汽车“零号工厂”装50台机器人，千余被裁员工复工前景堪忧

06-24

小米YU7 GT实力出圈！创浙赛自动驾驶圈速纪录还登顶纽北赛道

06-24

硬件防窥屏成新趋势？国产手机纷纷跟进，是实用还是“带偏”？

06-24

豆包正式推出专业版，包月最低68元最高500元

06-24

台积电7nm及以下先进制程全面涨价，AI需求成背后关键推手

06-24

荣耀MagicOS 11超前点映开启推送，动态液态玻璃效果引领设计新潮流

06-24

霍启刚谈AI浪潮：青年培养需重思维构建借AI拓展能力边界

06-24

小米REDMI K90至尊版6月30日发布：风冷散热加持剑指3K档游戏性能旗舰

06-24

豆包专业版重磅上线：办公任务模式升级，支持本地操作与Agent任务，月费最高500元

06-24

特斯拉六度登顶美国本土制造榜，Model 3逆袭Model Y再成冠军

06-24

游戏开发用AI遭“偏见”：优质项目或因负面口碑错失成功？

06-24

2026年前四月新能源高阶智驾普及迅猛燃油车高阶配置升级明显滞后

06-24

理想汽车力挺增程技术：5C增程破局纯电增程各有应用场景

06-24

苹果四款AirPods迎开发者测试固件更新：自定义均衡器等iOS 27新功能抢先体验

06-24

点击查看更多 +

全站最新

五大平台种草逻辑大不同：母婴品牌如何精准匹配平台特性？

鸿蒙7：告别追赶时代，以创新之力开启全场景智能新纪元

雷军晒小米SU7 Pro续航突破：902公里背后三电技术有何过人之处？

马云率阿里高管下田插秧：以“种地”之姿，All in AI 谋长远发展

2026快手珠宝文玩配饰行业洞察：流量攀升，消费增长，细分赛道亮点纷呈

电商运营全攻略：深度剖析小红书、快手、抖音、微博四大平台玩法

热门内容

本栏最新

网界 - 新财经新科技新未来 - 网界传媒旗下网站 - 中国 · 北京
合作咨询微信：netspread（注明:网界）
网界^®是本公司38类注册商标，是该商标的唯一持有者，未经授本公司授权，严禁使用。
Copyright © CNU 2012-2022 www.cnu.com.cn All rights reserved. 鲁ICP备2022032383号-6 鲁公网安备37010202700502号