网界手机网站站内搜索

科技·商业·财经媒体

科技·商业·财经

滚动资讯

当前位置：网界 > 数据洞察 > 正文内容

英伟达与MIT合作推出Audio-SDS：AI音效生成迎来参数化控制新突破

时间：2025-05-13 14:29 作者：苏婉清

近日，科技界传来一项新的合作成果，英伟达与麻省理工学院（MIT）携手推出了Audio-SDS技术，这是一项基于文本条件的音频扩散模型扩展技术，为音频生成领域带来了新突破。

音频扩散模型在近年来凭借其生成高质量音频的能力备受瞩目。然而，这类模型的一个显著局限在于难以对明确且可解释的参数进行优化，这限制了其在实际应用中的灵活性和广泛性。

为了克服这一挑战，英伟达与MIT的科研团队首次将Score Distillation Sampling（SDS）方法引入到音频领域。他们结合了预训练模型的强大生成能力与参数化音频表示，从而无需依赖大规模特定数据集，即可应用于FM合成器参数校准、物理冲击音合成以及音源分离等三大关键任务。

SDS技术此前已在文本生成3D图像和图像编辑领域得到了广泛应用。英伟达此次将SDS技术与音频生成相结合，推出了Audio-SDS。该技术能够利用预训练模型的先验知识，直接根据高级文本提示调整FM合成参数、冲击音模拟器或分离掩码，从而实现了更加灵活和精准的音频生成。

在实验中，研究团队采用了基于解码器的SDS、多步去噪以及多尺度频谱图等方法。实验结果表明，Audio-SDS在主观听觉测试和客观指标（如CLAP分数、信号失真比SDR）上均展现出了卓越的性能。

Audio-SDS的一大创新之处在于，它仅需一个预训练模型即可支持多种音频任务，从而极大地降低了对大规模领域特定数据集的依赖。这一特性使得Audio-SDS在音频生成领域具有更广泛的应用前景。

然而，研究团队也指出了Audio-SDS目前仍面临的一些挑战，包括模型覆盖范围有限、潜在编码伪影以及优化敏感性等问题。他们表示，未来将继续致力于解决这些问题，以进一步提升Audio-SDS的性能和应用范围。

更多>同类内容

Milk-V发布Jupiter NX，RISC-V架构挑战英伟达Jetson NX市场

05-13

哔哩哔哩提高门槛：5000粉丝起才能用第三方工具开播

05-13

蓝牙技术2025年或迎爆发，全球设备出货量将超54亿台

05-13

深圳支付机构违规遭重罚，快付通与顺丰支付合计被罚372万

05-13

中美取消大部分加征关税，科技股迎来大涨潮！

05-13

AG600批产首机成功下线！适航验证全面展开，后续机型进展迅速

05-13

《毁灭战士：黑暗时代》豪华版上线，中世纪恶魔歼灭战一触即发！

05-13

Safe Exam Browser 3.8版发布，Windows 11 24H2升级限制解除

05-13

小米胜诉！聚好看公司因商业诋毁被判赔55万

05-13

GTA4移植次世代主机进行时，马克思佩恩3也将迎来新平台？

05-13

华为nova 14系列携鸿蒙5来袭，全场景生态再升级，智慧办公新时代？

05-13

烟台台海核电水下装备工程：钢结构主体封顶，机电安装阶段全面开启！

05-13

谷歌App图标悄然换新颜，渐变色彩更显柔和现代

05-13

长三丙火箭重出江湖，通信技术试验卫星十九号发射圆满成功！

05-13

天猫618今晚预售开启，85折加大额券，立减优惠无需算计！

05-13

点击查看更多 +

全站最新

英伟达与MIT合作推出Audio-SDS：AI音效生成迎来参数化控制新突破

英伟达与MIT合作推出Audio-SDS：AI音效生成迎来参数化控制新突破

《狂野时代》戛纳首映倒计时，科幻悬疑梦境之旅即将启程

《狂野时代》戛纳首映倒计时，科幻悬疑梦境之旅即将启程

瀚铠RX 9070 XT显卡：夏日游戏大作畅玩新利器？

瀚铠RX 9070 XT显卡：夏日游戏大作畅玩新利器？

微软放宽限制，Safe Exam Browser用户可升级至Windows 11 24H2

微软放宽限制，Safe Exam Browser用户可升级至Windows 11 24H2

华为鸿蒙电脑登场，全场景生态战略迈入新阶段，能否撼动Windows地位？

华为鸿蒙电脑登场，全场景生态战略迈入新阶段，能否撼动Windows地位？

5499元档大对决：苹果iPhone 16 Pro与华为Mate 70 Pro，你选谁？

5499元档大对决：苹果iPhone 16 Pro与华为Mate 70 Pro，你选谁？

热门内容

本栏最新

英伟达与MIT合作推出Audio-SDS：AI音效生成迎来参数化控制新突破

英伟达与MIT合作推出Audio-SDS：AI音效生成迎来参数化控制新突破

Milk-V发布Jupiter NX，RISC-V架构挑战英伟达Jetson NX市场

Milk-V发布Jupiter NX，RISC-V架构挑战英伟达Jetson NX市场

蓝牙技术2025年或迎爆发，全球设备出货量将超54亿台

蓝牙技术2025年或迎爆发，全球设备出货量将超54亿台

深圳支付机构违规遭重罚，快付通与顺丰支付合计被罚372万

深圳支付机构违规遭重罚，快付通与顺丰支付合计被罚372万

中美取消大部分加征关税，科技股迎来大涨潮！

中美取消大部分加征关税，科技股迎来大涨潮！

AG600批产首机成功下线！适航验证全面展开，后续机型进展迅速

AG600批产首机成功下线！适航验证全面展开，后续机型进展迅速

网界 - 新财经新科技新未来 - 网界传媒旗下网站 - 中国 · 北京
合作咨询微信：netspread（注明:网界）
网界^®是本公司38类注册商标，是该商标的唯一持有者，未经授本公司授权，严禁使用。
Copyright © CNU 2012-2022 www.cnu.com.cn All rights reserved. 鲁ICP备2022032383号-6