谷歌的人工智能语音模型将在增强现实眼镜内提供实时翻译服务

   时间:2023-03-08 10:52 来源:网界科技

【网界科技】3月8日消息,人工智能语音模型在全球范围内推动跨语言交流

谷歌正在朝着建立一个支持1000种不同语言的人工智能语言模型的目标迈进。这项目标对于全球范围内的语言交流和信息共享具有重要意义。

谷歌的通用语音模型(USM)是实现这一目标的关键第一步。USM是一个包含20亿个参数的语音模型系列,在1200万小时的语音和超过300种语言的280亿个句子中进行训练。去年11月,谷歌宣布计划创建一个支持全球1000种最常用语言的语言模型,并披露了USM模型。目前,USM已经支持超过100种语言,并将作为建立更加广泛的系统的基础。

USM已经在YouTube上使用,用于生成封闭式字幕和自动语音识别(ASR)。该模型还支持自动检测和翻译语言,包括英语、普通话、阿姆哈拉语、宿务语、阿萨姆语等等。

据网界科技了解,该技术的一个可能应用是在增强现实眼镜内提供实时翻译服务。这将极大地便利全球范围内的跨语言交流。然而,这项技术目前仍处于早期阶段,还存在一些出错的风险。在去年的I/O活动中,谷歌对阿拉伯语的错误表述就是一个例子。

谷歌在语言模型和机器学习领域的努力为我们提供了更多跨越语言和文化障碍的可能性。随着技术的不断进步,我们有理由相信,在未来,人工智能语音模型将在全球范围内推动跨语言交流,实现更加紧密的文化交流和信息共享。

 
 
更多>同类内容
全站最新
热门内容