英伟达GTC活动发布Cosmos 3：双模块架构助力物理世界AI建模新突破

时间：2026-06-05 03:26 作者：互联网

在台北举办的GTC活动上，英伟达正式推出了一款名为Cosmos 3的全新模型，并宣称其为全球首个“完全开放的全能型人工智能模型”。该模型专为机器人、自动驾驶汽车以及视觉智能体设计，核心能力聚焦于基于视觉的推理，同时具备生成文本、图像、视频、环境声音和动作等多模态内容的强大功能。

Cosmos 3采用了独特的双模块架构，由推理Transformer和生成Transformer共同构成。推理模块负责解析物体之间的交互关系、运动轨迹以及时空逻辑，为模型提供对现实物理世界的深度理解；生成模块则基于推理结果，输出高质量的视频内容和动作轨迹。这种设计使模型能够先理解物理互动的规律，再生成与之匹配的画面和行为，从而大幅提升对复杂环境的建模能力。

英伟达强调，Cosmos 3的研发目标直指机器人、自动驾驶车辆和视觉智能体在真实环境理解中长期存在的痛点。当前，相关领域的训练数据稀缺，仿真系统分散，导致机器学习物理世界规律时面临重重障碍。Cosmos 3通过原生支持多模态信息的生成与理解，以更高的物理准确性模拟现实世界，为这些应用提供了更可靠的基础模型。

从应用场景来看，Cosmos 3的定位十分灵活。它既可以作为视觉语言模型，直接处理图像与文本的交互任务；也可以作为世界模型，模拟物理环境并预测未来状态；甚至可以作为其他世界模型的底层平台，支持更广泛的扩展与创新。这种多功能性使其能够适应不同领域的需求，为人工智能技术的落地提供更多可能性。

在产品规划方面，英伟达已推出两款不同版本的Cosmos 3：响应精度最高的Cosmos 3 Super和轻量级的Cosmos 3 Nano，两者均已正式投入使用。面向边缘设备实时推理需求的Cosmos 3 Edge版本也将在后续发布，进一步拓展模型的应用范围。

技术层面，Transformer作为一种擅长处理序列数据上下文关系的深度学习神经网络，通过并行计算显著提升了生成效率。英伟达此次将推理与生成能力深度融合，旨在为机器人和自动驾驶系统构建一个更贴近真实物理世界的基础模型，从而推动这些领域向更高水平的智能化迈进。

更多>同类内容

从“一块钱卖厂”到“20亿美元建厂”：中日制造格局重塑，合作新篇已启

06-05

特斯拉Robotaxi奥斯汀全域运营扩张车队规模受限商业化考验待解

06-05

Uber发力自动驾驶：豪掷重金绑定核心伙伴，轻资产模式加速全球扩张

06-05

零跑6月16日放大招！新款C10全方位升级，或成家用新能源SUV新宠

06-05

5月车企销量揭晓：比亚迪领跑新能源车，海外拓展与方程豹成增长双引擎

06-05

英国工作室联手宾利打造纯电复古车：手工精制、85%复刻、限量独一份

06-05

凯越衰落与张雪崛起：从“三条件”看国产摩托技术路线之争

06-05

增程技术标准焕新升级赛力斯引领行业迈向高质量新征程

06-05

新车机油消耗快是正常现象？弄清原理，新手车主养车不花冤枉钱

06-05

安克创新二次递表港股：智能设备领军者，业绩稳健再启新程

06-05

AI浪潮下，企业组织如何变革？谁将站上价值创造塔尖？

06-05

AI浪潮下逆袭典范：诺基亚与黑莓凭技术底蕴斩获百亿红利

06-05

纳指跌幅收窄至0.5%，博通跌14.5% 谷歌A逆市涨3.5%

06-05

私有化即时通讯：企业数字化办公从“工具堆叠”到“底座支撑”的转型之路

06-05

谷歌6月安卓更新优化密码迁移，Find Hub定位升级，伦茨科技芯片兼容双系统

06-05

点击查看更多 +

全站最新

深铁与华为携手：Wi-Fi 7车地无线通信方案落地引领轨交智慧新未来

日本电商市场：乐天与亚马逊大比拼，哪个平台契合你的商业目标？

阿里“悟空”VS飞书“aily”：企业级AI Agent的生态整合与智能伙伴之争

百度伐谋助力北工大苗扬团队：AI赋能科研，开启系统寻优新时代

谷歌Gemini成绩亮眼：搜索AI概览月活25亿，App月活破9亿且增长迅猛

华为智能光伏战略与新品发布：以技术创新引领新型电力系统构建新征程

热门内容

本栏最新

网界 - 新财经新科技新未来 - 网界传媒旗下网站 - 中国 · 北京
合作咨询微信：netspread（注明:网界）
网界^®是本公司38类注册商标，是该商标的唯一持有者，未经授本公司授权，严禁使用。
Copyright © CNU 2012-2022 www.cnu.com.cn All rights reserved. 鲁ICP备2022032383号-6 鲁公网安备37010202700502号