谷歌Gemini 3.5 Live Translate发布，多语言实时互译跨语言交流更顺畅

时间：2026-06-10 09:46 作者：鞭牛士

谷歌公司近日推出了一款名为Gemini 3.5 Live Translate的实时语音互译音频模型，标志着实时翻译技术迈入全新阶段。该模型支持超过70种语言的自动识别与转换，不仅能够生成自然流畅的翻译语音，还能精准还原说话者的语调、语速和音高特征，使跨语言交流更接近真实对话体验。

与传统翻译系统需要等待完整语句输入后才能启动翻译不同，Gemini 3.5 Live Translate采用动态处理机制。它通过持续分析语音流中的上下文信息，在保证翻译质量的前提下实现即时输出，将延迟控制在仅数秒之内。这种平衡策略有效避免了交流过程中的尴尬停顿，使对话节奏更加自然连贯。

技术团队特别强化了模型的抗干扰能力，使其能在嘈杂环境中保持稳定表现。无论是多语言混合输入还是复杂背景噪音，系统都能自动识别目标语言并完成转换，无需用户手动切换设置。这一特性使其特别适用于国际会议、跨国直播等需要快速响应的场景。

在应用落地方面，谷歌采取了分阶段推广策略。开发者可通过Gemini Live API和Google AI Studio抢先体验公开预览版；企业用户自本月起能在Google Meet会议平台使用私有预览功能；普通消费者则可通过Android和iOS版谷歌翻译应用直接调用该服务。所有版本均支持通过任意耳机连接实现实时翻译，译文语音会尽可能贴近原始说话者的表达风格。

针对Android设备用户，谷歌还将逐步推送专属的"聆听模式"。该功能允许用户将手机贴近耳部，通过听筒直接收听翻译内容，既保护隐私又摆脱了对耳机的依赖。这种设计特别适合需要保持低调的公共场合，例如商务洽谈或国际旅行场景。

从技术架构来看，Gemini 3.5 Live Translate实现了语音识别、语义理解和语音合成的全链路优化。其核心优势在于能够同步处理语音流中的多重信息，在保持低延迟的同时确保翻译准确性。这种端到端的设计理念，为实时翻译技术的商业化应用开辟了新路径。

06-10

经纬辉开(300120.SZ)：铱加科技当前1.6T光模块尚在研发中，未取得重大突破

06-10

金泰能源控股(02728.HK)今早复牌

06-10

A股长飞光纤股价创历史新高

06-10

恒指期货低开0.98%

06-10

武汉凡谷：氮化铝陶瓷基板有技术储备但无产品交付

06-10

上市公司近一月回购总额超170亿元头部企业示范效应渐显

06-10

钉钉风波升级：离职副总裁登上脉脉热搜，评论区大战前同事

06-10

现货黄金跌约1.6%，白银跌超4%

06-10

尾盘反弹！道指小幅收涨，芯片股下挫拖累纳指收跌近1%，ARM跌超6%

06-10

乔治亚大学TRON框架革新：为AI打造动态视觉推理训练新范式

06-10

医学AI新考场：加州大学与NVIDIA联手测试AI“医研员”真实能力

06-10

入华7年难撼山姆地位，开市客入驻京东弱化会员门槛求破局？

06-10

Anthropic逆袭OpenAI：聚焦企业与编程，AI赛道上演后来者居上

06-10

胜华波再战IPO：车身智能电机成新亮点，产能消化待考

06-10

点击查看更多 +

全站最新

钉钉副总裁马锐拉离职，发文坦言高压熬夜难持续，祝福钉钉再创辉煌

大模型迭代引发适配难题？谷云科技AI网关为企业AI业务筑牢稳定防线

俞敏洪中国旅游企业家年会畅谈：以远行之心，开启文旅新征程

从义乌小店到万亿赛道：解码AI公司“码上飞”如何打造商业Agent新基建

阿里AI布局再深化：Token Foundry事业部成立，吴泳铭领航前沿探索

丰巢快递柜取件先遇广告“拦路”，稍不留意跳转购物，客服回应引关注

热门内容

本栏最新

网界 - 新财经新科技新未来 - 网界传媒旗下网站 - 中国 · 北京
合作咨询微信：netspread（注明:网界）
网界^®是本公司38类注册商标，是该商标的唯一持有者，未经授本公司授权，严禁使用。
Copyright © CNU 2012-2022 www.cnu.com.cn All rights reserved. 鲁ICP备2022032383号-6 鲁公网安备37010202700502号