谷歌Gemini Omni模型发布：跨模态编辑新突破，自然语言指令轻松改大片-网界

在最新一届Google I/O开发者大会上，谷歌推出了具有突破性意义的Gemini Omni多模态人工智能模型。这款模型不仅能够处理文本、图像、音频和视频等多种输入形式，还具备跨模态内容生成与编辑能力，标志着人工智能技术在多媒体处理领域迈出了重要一步。

据谷歌介绍，Gemini Omni在音频处理方面已实现初步突破。虽然目前仅支持语音输入功能，但公司计划在短期内扩展更多类型的音频输入能力，进一步丰富用户交互方式。这一特性使其在语音助手、智能客服等场景中具有广泛应用潜力。

该模型的核心优势体现在其深度视频编辑功能上。用户只需通过自然语言指令，即可对视频内容进行精细修改，包括添加或删除特定对象、调整摄像机视角、改变场景环境与艺术风格等操作。这种交互方式显著降低了视频创作的专业门槛，使普通用户也能轻松完成高质量视频制作。

在内容生成质量方面，Gemini Omni展现出强大的逻辑推理能力。通过对物理规律的理解和跨学科知识的整合，模型生成的视频在角色行为、场景转换和视觉叙事上保持高度连贯性，甚至能够根据上下文自动推演后续情节发展。更引人注目的是，用户可以创建个性化数字分身，并将其自然融入视频场景中。

针对生成内容的安全性问题，谷歌同步推出了技术保障措施。所有通过Gemini Omni生成的视频都会自动嵌入SynthID数字水印，这种隐形标记可通过Google搜索和Chrome浏览器进行验证，有效防止虚假信息的传播。这一举措体现了谷歌在推动AI技术创新的同时，对内容真实性的高度重视。

在产品落地方面，首发版本Gemini Omni Flash已通过Gemini应用向个人用户开放。拥有Google AI Plus/Pro/Ultra订阅服务的用户，以及YouTube Shorts混剪创作者和YouTube Create应用用户，均可免费体验这项新技术。企业客户稍后将获得API接口权限，以便将模型能力集成到自有产品中。

Google DeepMind负责人哈萨比斯在发布会上强调，Gemini Omni代表了人工智能发展的重要方向。通过整合多模态处理能力和复杂场景理解，该模型正在推动AI系统从执行特定任务向具备通用认知能力演进，为构建更智能的人机协作模式奠定了基础。

从伦敦到硅谷，一位谷歌AI核心科学家的14年 Andrew Dai：我读博士研究的是人工智能，从中学起就一直想做AI。DeepMind那时候还是一家很小的初创公司，我甚至不知道有DeepMind这家公司，…

“小龙虾之夜”从2021年首届500人破冰至今，早已不是简单的员工聚餐：今年数千斤直采自“中国小龙虾之乡”潜江的鲜活龙虾堆成小山，每一只都带着鄂东平原的水汽；活动现场联合「一起公益」发起“吃虾有爱，点亮书梦”…

之前iOS26.4.2那续航真的拉胯，掉电快得离谱，我刷一小时抖音都能掉13%多的电！以上就是iPhone15更完iOS26.5的真实使用感受啦，这次更新真的实打实优化了续航，电池更经用了，还把信号和流畅度…

从 2016 年的MDR-1000X 启航，1000X系列开启长达十年的持续升级，树立并不断刷新消费级耳机行业新基准，2017 年WF-1000X 降噪豆惊艳登场，将索尼引以为傲的降噪技术突破性地引入轻巧机…

未来，RAPTIC将以泰国为亚太支点，辐射东南亚其他市场；持续聚焦材料创新与防护技术研发，推出更多符合全球用户需求的高端3C数码配件；同时深化与KOAN的战略合作，完善渠道体系，赋能本地经销商，推动新一代材料…

在华为期间，他主导搭建了首个实时交互媒体基础设施团队，构建起涵盖生成式视频、实时渲染与物理引擎的底层技术体系，并曾凭借媒体基础设施领域的重大突破获得号称资源调度领域的"诺贝尔"奖——Franz Edelma…

IT之家 5 月 20 日消息，在今日的 2026 谷歌 I/O 开发者大会上，谷歌宣布在谷歌街景（Street View）服务中结合Project Genie 的世界生成能力，进一步扩展这套通用世界模型的…

迈从Ace 68采用了先进的磁轴技术，与传统的机械轴不同，磁轴是通过磁场感应来触发按键的。它以8KHz轮询率、0.1ms延迟和189元起的高性价比，成功打破了磁轴键盘的价格壁垒，为FPS游戏玩家提供了一个体…

石头科技产品线扩张现有产品：智能扫地机器人、洗地机。 2026CES：G-Rover轮足式智能扫地机器人，具备自主爬楼功能，突破传统清洁限制。技术投入研发团队：超千人规模，全球五大研发中心。发展战略 …

网界 - 新财经新科技新未来 - 网界传媒旗下网站 - 中国 · 北京
合作咨询微信：netspread（注明:网界）
网界^®是本公司38类注册商标，是该商标的唯一持有者，未经授本公司授权，严禁使用。
Copyright © CNU 2012-2022 www.cnu.com.cn All rights reserved. 鲁ICP备2022032383号-6 鲁公网安备37010202700502号