滚动资讯

当前位置：网界 > 智能出行 > 正文内容

黄仁勋预言成真！中国公司“流式多模态”开启物理AI量产新时代

时间：2026-07-02 19:45 作者：苏婉清

在拉斯维加斯举办的CES展会上，英伟达创始人兼CEO黄仁勋宣布，AI技术正式迈入物理世界的新阶段。他指出，AI的演进经历了感知、生成、智能体和物理四个阶段，而真正让AI走出屏幕的关键，在于理解质量、摩擦、惯性等物理特性。黄仁勋强调，机器人等物理设备需要的不只是单一模型，而是一套完整的智能系统。

随着AI技术向物理世界渗透，机器人、无人机、安防摄像头和可穿戴设备等场景对AI的需求发生了根本性变化。这些设备不再满足于简单的问答交互，而是需要具备持续工作、主动执行任务的能力。业内专家指出，通用视觉智能将成为物理AI规模化应用的核心技术，其重要性甚至超过了一些表演性场景。

通用视觉智能要求模型能够像人类一样持续观察环境、精准定位目标并自主驱动行动，且所有处理必须在端侧完成。近日发布的VLX端侧流式多模态模型系列，正是这一技术路径的最新成果。该系列首次提出"流式多模态"架构，突破了传统模型"采集-上传-离线处理"的模式，实现了对持续视频流的毫秒级实时感知，并在端侧完成了从感知到决策的完整闭环。

VLX系列包含三个核心模型：Flow、Seek和Go，分别对应持续感知、精准定位和行动输出三层能力。Flow模型采用流式视频输入架构，可自主不间断运行，无需人工触发；Seek模型通过区域指代机制实现毫米级空间定位，解决了传统模型只能描述画面内容却无法输出精确坐标的问题；Go模型则能直接输出设备可调用的导航航点，支撑机器人自主移动。

基准测试数据显示，VLX系列在多项指标上超越了主流大模型。Seek-3B在目标检测、复杂语义理解等任务中，以30亿参数实现了与Gemini 3.1 Pro和GPT-5相当的精度；Go（0.6B）在机器人导航任务中，以极小参数量实现了85.42%的高成功率，跟踪率达94.08%，显著领先于参数量大13倍的对比模型。端侧推理延迟仅0.1秒，较云端推理的5秒以上有了质的提升。

这种性能突破源于架构层面的创新。传统模型依赖长上下文处理视频输入，本质仍是离线模式。VLX则构建了持续运转的"视觉中枢"，视频流像水一样流入模型，形成不间断的感知流。技术团队针对端侧算力约束进行了专门优化：Flow采用Linear Attention机制防止显存溢出；Seek通过区域指代降低计算量；Go使用短时航点预测实现快速响应。

VLX系列已在实际场景中实现大规模落地。在具身智能领域，该模型支持云深处、宇树等企业的机器人平台，显著缩短了算法迁移周期；无人机搭载VLX后，可自主完成巡检、避障和航线规划，效率提升数倍；在可穿戴设备方面，好马APP已服务近10万视障用户，通过AI助视眼镜实现安全避障和空间导航。VLX还完成了与苹果、联想、惠普、英伟达等品牌的端侧适配，为PC设备注入实时视觉理解能力。

针对国产芯片算力受限的问题，VLX通过专门优化实现了在华为昇腾、地瓜、RK3588等平台上的流畅运行。这种从端侧需求出发的设计思路，使部署成本大幅降低，实时响应能力提升数十倍，为物理AI的普及提供了可行路径。目前，VLX系列模型已向开发者开放体验平台，进一步降低了端侧智能应用的研发门槛。

更多>同类内容

玻璃女王周群飞：从打工妹到3000亿掌门人，跨界VC押注科技未来

07-02

通奥检测递表港交所：57岁董事长沈海洪履历丰富身兼多职引关注

07-02

乐享科技获蚂蚁集团领投近5亿Pre-A轮融资，发布元点Zeroth品牌及多款新品

07-02

昆仑万维天工AI成绩斐然：ARR超8亿美元，引领短剧进入AI原生时代

07-02

天工3.2升级推出Skywork Tags：团队共享AI助手，透明接力越用越强

07-02

影石刘靖康谈行业竞争：不参与价格战，以技术筑壁垒谋长远发展

07-02

零跑汽车董事长朱江明与股东傅利泉近期增持481.42万股H股持股占比达25.05%

07-02

乐享科技获近5亿Pre-A轮融资

家庭具身智能领域迎来重要突破——苏州乐享智能科技有限公司（以下简称“乐享科技”）宣布完成近5亿元Pre-A轮融资，并正式推出家庭具身智能品牌“元点Zeroth”。此次融资由蚂蚁集团领投，吉利资本、三七互娱、元禾璞华等产业资本跟投，老股东Monolith持续超额加码，标志着家庭具身智能赛道进入规模化发展新阶段。

07-02

正雅齿科冲刺创业板IPO：姚峻峰掌控超四成表决权留学背景助力发展

07-02

图灵奖得主Richard Sutton到访北京人形机器人创新中心

近日，国际人工智能领域迎来一则备受瞩目的消息——图灵奖得主、被誉为“强化学习之父”的Richard Sutton现身北京人形机器人创新中心，与该中心CEO熊友军及核心团队展开深入交流。

07-02

优必选CEO周剑：机器人或于未来数十年接手工作，人类将转向创新领域

07-02

2026智能学习机怎么选？科大讯飞T30护眼大屏+智能辅导成家长优选

科大讯飞T30系列在技术研发和产品设计上一直保持领先地位，其产品不仅在硬件配置上具备明显优势，更在智能辅导和答疑系统上进行了深度优化，能够实时响应学生的学习需求。未来星智能教育机则在交互体验和创新功能上有独到…

07-02

河南金融监管局批复：周锋正式获核准担任中原银行董事长一职

07-01

浙江通服携手阿里云：共拓AI合作新篇，在多领域展开深度协同发展

7月1日，据阿里云消息，近日，浙江省通信服务控股集团有限公司与阿里云签署AI战略合作协议，双方将围绕大模型Token运营、智算中心建设、算电协同、行业应用、海外市场拓展等方向开展合作。在行业应用方面，双方…

07-01

石头科技6月30日股价微涨1.52% 主力资金净流入超千万机构看好后市

证券之星消息，截至2026年6月30日收盘，石头科技(688169)报收于94.97元，上涨1.52%，换手率1.97%，成交量5.1万手，成交额4.81亿元。 6月30日的资金流向数据方面，主力资金净流入1…

07-01

点击查看更多 +

全站最新

天工3.2升级Skywork Tags：Agent入群协作，开启团队共享AI新篇章

灵珠获天使轮融资：降低AI创作门槛，助力非技术人员实现应用开发梦

京东与长安汽车携手：数智赋能推动汽车制造服务升级新实践

春水堂仿真人形伴侣机器人开启预售，聚焦陪伴场景，1.5万元级能否走进生活？

乐享科技获近5亿Pre-A轮融资

技术赋能与人文坚守：杨君媒介理论三次跃迁下的传播范式革新

热门内容

本栏最新

网界 - 新财经新科技新未来 - 网界传媒旗下网站 - 中国 · 北京
合作咨询微信：netspread（注明:网界）
网界^®是本公司38类注册商标，是该商标的唯一持有者，未经授本公司授权，严禁使用。
Copyright © CNU 2012-2022 www.cnu.com.cn All rights reserved. 鲁ICP备2022032383号-6 鲁公网安备37010202700502号