字节跳动旗下豆包App迎来重大升级,其语音通话功能正式接入全新原生全双工语音大模型Seeduplex。该模型通过突破性技术架构,实现了对话流畅度与交互自然度的质的飞跃,标志着语音交互领域进入"边听边说"的新纪元。

相较于传统半双工模型需要等待用户说完才能响应的局限,Seeduplex采用创新的全双工框架设计,使系统能够同时处理语音输入与输出。这种技术突破让机器具备类似人类的"边听边思考"能力,在用户停顿、思考或表达过程中即可生成自然回应,彻底改变了以往语音交互的机械感。测试数据显示,新模型在复杂声学环境下的误回复率降低50%,对话节奏控制能力提升40%,真正实现了"有来有往"的拟人化交流。
该模型的核心技术突破体现在两大维度:在抗干扰能力方面,通过持续声学环境感知技术,可精准区分目标语音与背景噪音,即便在地铁、商场等嘈杂场景中,依然能保持95%以上的识别准确率;在对话节奏控制上,独创的动态判停机制结合语音特征与语义理解,既能耐心等待用户组织语言,又能在表达结束瞬间快速响应,抢话现象减少40%,对话流畅度提升35%。
多维度评测显示,Seeduplex在对话自然度、响应及时性等关键指标上全面超越行业主流方案。特别是在判停准确率方面,较传统半双工模型提升8个百分点,达到92%的行业领先水平。大规模用户测试证实,升级后的语音通话功能使用时长增加22%,用户留存率提升15%,通话满意度绝对值提高8.34%,"抢话""延迟响应"等负面反馈显著减少。
目前,用户只需将豆包App更新至最新版本,在对话框选择"打电话"功能即可体验。为提升沉浸感,系统特别优化了"桃子音色"的语音表现,使交互更具情感温度。此次升级不仅标志着语音交互技术的重要突破,更为智能助手、在线客服等场景提供了新的技术范式,推动人机对话向更自然、更高效的方向发展。








