Stability AI发布Stability Audio 3.0：多规格模型助力，最长可生成六分钟专业音乐

时间：2026-05-21 03:25 作者：互联网

AI音频生成领域迎来新突破，知名初创公司Stability AI正式发布Stability Audio 3.0系列模型，其中旗舰版本可生成超过六分钟的专业级音乐作品。该系列包含四款不同参数规模的模型，覆盖从设备端轻量化应用到云端高性能创作的全场景需求。

新发布的模型家族采用差异化设计策略：两款小型模型分别拥有45900万参数和14亿参数，专为移动端和边缘设备优化，可在本地生成两分钟以内的音频内容；中型（14亿参数）和大型（27亿参数）版本则具备更复杂的音乐结构控制能力，支持创作完整乐曲并保持旋律连贯性。相较于2024年推出的Stable Audio 2.0，新模型的最大生成时长实现翻倍提升，达到6分20秒。

在开源策略方面，该公司采取分层开放模式：小型SFX模型、基础小型模型及中型模型已向公众开放源代码和模型权重，允许开发者自由下载修改；而具备最强性能的大型模型则通过API接口和付费托管服务提供，年营收超100万美元的企业需额外购买商业授权。这种模式既保障了技术普惠性，又为商业应用建立了保护机制。

为确保数据合法性，Stability AI提前与华纳音乐集团、环球音乐集团等头部机构建立战略合作，所有训练数据均获得正式授权。这种前瞻性布局有效规避了音乐版权领域的潜在风险，为模型商业化铺平道路。目前公司正开发面向专业音乐人的工具链，前环球音频首席数字官伊桑·卡普兰已加盟主导该产品线，其过往在音乐科技领域的经验或将加速产品落地。

技术实现层面，新模型通过改进注意力机制和分层架构设计，显著提升了长序列生成能力。在保持音乐风格一致性的同时，能够处理更复杂的和声编排与节奏变化。测试数据显示，中型模型在古典音乐生成任务中，结构完整性评分较前代提升37%，而大型模型在流行音乐创作场景下，用户满意度达到92%。

更多>同类内容

小米YU7 GT：纽北磨砺稳定性，千匹动力续航长，OTA升级稳推进

05-21

谷歌加速AI布局：五大产品用户超30亿搜索大改版与新AI工具齐发

05-21

雷军坦言小米YU7GT“有点小贵”，豪华定位配高性能能否赢得市场？

05-21

美妆行业告别高增长时代，珀莱雅与欧莱雅增设CGO探寻新增长路径

05-21

小米YU7 GT：纽北最速光环加持，性能拉满，定价会再掀波澜吗？

05-21

CEO换人、股权易主，开普勒机器人“投身”上市公司背后何去何从？

05-21

长鑫科技冲刺科创板：一季度营收净利双增，5月27日将迎IPO上会大考

05-21

长鑫科技科创板IPO迎关键节点 5月27日上会审核备受瞩目

05-21

国家能源局4月用电数据：充换电与数据服务用电飙升，高耗电时代来临

05-21

京东方A与康宁深化合作共探四大前沿领域携手提升全球产业竞争力

05-21

天创时尚资本动作频出：拟减持回购股份浮盈可观，新员工持股计划启航

05-21

香港中旅以实物分派分拆港澳文旅并以介绍方式上市

05-21

昆明蓝花楹盛放：从绿化到文旅IP，多元业态激活文商旅消费新活力

05-21

阳光乳业2025年营收4.7亿股东会落幕，以稳健之姿续写“老字号”新篇

05-21

法治赋能民营经济：一秒钟见证创新力量，一年间焕发蓬勃生机

05-21

点击查看更多 +

全站最新

数智赋能英语课堂思维引领主动阅读——“四季杏坛”杭州场聚焦教学新实践

字节AI时代再崛起：战略清醒、生态配合与组织力成制胜关键

阿里云2026峰会重磅发布：全栈Agent化升级，打造AI时代开放云生态

蔡崇信吴泳铭致股东信：AI业务入回报期，AI+云成阿里新增长引擎

户外消费新图景：年轻人成主力军，国货崛起折扣渠道受青睐

百度一季度AI收入首超广告成“顶梁柱”，资本开支激增，李彦宏押注AI未来

热门内容

本栏最新

网界 - 新财经新科技新未来 - 网界传媒旗下网站 - 中国 · 北京
合作咨询微信：netspread（注明:网界）
网界^®是本公司38类注册商标，是该商标的唯一持有者，未经授本公司授权，严禁使用。
Copyright © CNU 2012-2022 www.cnu.com.cn All rights reserved. 鲁ICP备2022032383号-6 鲁公网安备37010202700502号