滚动资讯

当前位置：网界 > 行业动态 > 正文内容

谷歌I/O前夕Veo 4泄露：多机位叙事原生音频，AI视频迎来导演级革命

时间：2026-05-17 18:48 作者：格隆汇

谷歌I/O大会前夕，一场关于AI视频生成技术的重大泄露引发行业震动。据多方消息披露，谷歌即将推出的Veo 4或Gemini Omni模型可能突破传统AI视频生成框架，实现多机位场景切换与原生音频同步的双重突破，标志着AI从“画面生成”向“叙事生产”的跨越式进化。

核心功能泄露显示，该模型可生成长达9秒的720p视频，支持多角度场景的无缝切换。与传统AI视频工具仅能生成单一长镜头不同，新模型被曝能同时处理多个视角的物理一致性、空间连贯性与时间同步性。例如，同一场景中的人物动作、服装细节、环境元素在不同机位间保持高度一致，这种技术突破被业内人士形容为“将导演的机位调度能力压缩进模型权重”。

音频同步能力的升级成为另一焦点。爆料称，新模型不仅能原生生成对话、环境音，还可根据画面情境自动匹配背景音乐。相较于前代Veo 3仅能处理脚步声、对话声等基础音频，此次升级意味着AI视频将实现“画面-音效-配乐”的全链条自动化生产。技术分析指出，这一突破可能通过多模态大模型架构实现，将音频生成与视觉理解深度耦合。

行业观察者将此次泄露置于OpenAI Sora停服的背景下解读。数据显示，Sora因高昂的推理成本（每日100万至1500万美元）与低迷的用户留存率（30天留存不足8%）最终退出市场，而谷歌选择此时曝光技术进展，被视为对AI视频生成商业化的重新定义。爆料人推测，谷歌可能已解决算力效率问题，其技术路线更侧重“成片输出”而非单一参数竞争。

泄露文件还透露，谷歌将同步推出Gemini 3系列模型矩阵，包括3Flash、3.1全系列（Pro/Flash Image/Lite/TTS）及高保真音频模型Lyria 3 Pro。最引人注目的是内部文档中提到的“Omni模型Agent版本”，暗示谷歌可能构建统一的AI生产框架，将视频、音频生成与智能代理（Agent）技术整合，形成覆盖创作全流程的工具链。

技术社区对此反应热烈。部分开发者通过逆向工程分析指出，多机位生成需解决三维空间重建、动态物体追踪等复杂问题，而原生配乐功能则涉及情感识别与音乐生成交叉领域。尽管泄露示例中仍存在少量连贯性瑕疵，但多数观点认为，若谷歌能在I/O大会演示中验证技术可行性，将彻底改变影视、广告等行业的创作模式。

目前，谷歌尚未对泄露信息作出回应，但行业普遍预期I/O大会将成为AI技术竞争的新分水岭。随着OpenAI退出视频生成赛道，谷歌与meta、Runway等企业的技术竞赛进入白热化阶段，而“叙事权”的争夺或将重新定义AI创作工具的边界。

更多>同类内容

数通链谷AI读书会：共探科技前沿，以知识赋能科创产业新发展

05-17

中科院团队成功构建人源“生物起搏器” 助力心律失常研究新突破

05-17

小米YU7“火山灰”配色惊艳亮相灵感源自火山地貌实车已到店

05-17

3人领衔100个AI程序员，月耗130万美元，OpenAI买单，软件开发新变革？

05-17

APEC中国年聚焦苏州：具身智能机器人开启长三角与世界的创新对话

05-17

摩尔线程携手国家具身智能中试基地，战略布局加速具身智能规模化落地

05-17

苏州机器人“训练场”火热：聚焦五大能力 140万条数据助力产业升级

05-17

蔚来李斌揭秘坚持纯电原因：错判根源不可取纯电优势在空间质变

05-17

长安汽车回应与千里科技合作传闻：暂无计划，坚持智驾技术自主可控

05-17

河南“VR+5G警务实战系统”亮相世界数字教育大会贡献智慧教育新方案

05-17

中国移动河南公司Token Plan升级：算力服务双轨并行普惠全民数字生活

05-17

比亚迪方程豹豹8和豹5闪充版云辇-P Ultra登场，三轮行驶挑战尽显硬核实力

05-17

理想L9新版本发布：大幅降价加优惠，能否重振市场雄风？

05-17

3人团队携百名AI“码农”月耗130万美元，OpenAI买单，软件开发新未来已来？

05-17

彭承志院士谈量子科技：秉持好奇心，人类定能在时代浪潮中绽放光彩不被AI取代

05-17

点击查看更多 +

全站最新

2026年PI与PET胶带行业变革：技术驱动下耐温防静电的供应商新选择

科大讯飞AI学习机深度评测：护眼设计搭配学习功能，哪款更适合孩子？

科大讯飞智能办公本深度评测：以科技赋能办公高效体验触手可及

七年坚守初心不改：科大讯飞“听见AI的声音”升级，为听障群体架沟通桥梁

招商时代公园天樾境C区：解锁新奢生活，预约看房享专属优惠与精装美宅

成都招商时代公园：天府新区核心地标旁，精装奢宅最新房价及购房咨询热线

热门内容

本栏最新

网界 - 新财经新科技新未来 - 网界传媒旗下网站 - 中国 · 北京
合作咨询微信：netspread（注明:网界）
网界^®是本公司38类注册商标，是该商标的唯一持有者，未经授本公司授权，严禁使用。
Copyright © CNU 2012-2022 www.cnu.com.cn All rights reserved. 鲁ICP备2022032383号-6 鲁公网安备37010202700502号