科技·商业·财经

谷歌推出Gemini 3.5 Live Translate模型,多语言实时互译体验再升级

   时间:2026-06-10 05:01 作者:快讯

谷歌公司近日宣布推出全新实时语音互译音频模型——Gemini 3.5 Live Translate,为跨语言交流带来革命性突破。该模型支持超过70种语言的自动识别与翻译,能够生成自然流畅的语音输出,同时完整保留说话者的语调、语速和音高等特征。

与传统翻译系统不同,Gemini 3.5 Live Translate采用动态处理机制,在保证翻译质量的同时实现近乎实时的响应速度。系统通过智能平衡"上下文优化"与"即时输出"两大需求,将翻译延迟控制在数秒之内,有效避免交流过程中的尴尬停顿。其抗干扰能力可适应嘈杂环境,无需用户手动切换语言设置即可自动识别混合输入。

该技术将通过多渠道逐步开放:开发者可通过Gemini Live API和Google AI Studio接入公开预览版;企业用户本月起可在Google Meet平台体验私有预览服务;普通消费者则能直接在Android/iOS版谷歌翻译应用中使用。特别针对Android设备推出的"聆听模式",允许用户像接听电话般通过听筒收听翻译内容,在保护隐私的同时解决无耳机场景下的使用需求。

实际应用场景涵盖国际会议、远程教育、直播互动等多个领域。用户连接任意耳机后,即可在70余种语言间实现无缝对话,翻译语音的语气特征与原始说话者高度吻合。谷歌工程师透露,该模型通过流式传输技术实现语音内容的同步处理,确保在复杂语言环境中仍能保持输出稳定性。

 
 
更多>同类内容
全站最新
热门内容