AI音频生成领域迎来重要突破,知名初创企业Stability AI正式发布Stability Audio 3.0系列模型,其中旗舰版本可生成超过六分钟的专业级音乐作品。该系列包含四款不同参数规模的模型,分别针对设备端部署与云端创作场景进行优化设计。
技术架构方面,该系列包含45900万参数的小型SFX与基础版、14亿参数的中型版本,以及参数规模达27亿的旗舰版本。两款小型模型专为移动设备优化,支持在终端设备本地生成两分钟以内的音频内容,而中大型版本则具备更强的结构控制能力,可创作完整乐曲并保持旋律连贯性。与前代Stable Audio 2.0相比,新模型的最大生成时长实现翻倍提升,达到6分20秒的行业领先水平。
在开源策略上,企业采取差异化开放模式。小型SFX、基础版及中型版本已向公众开放源代码与模型权重下载,允许开发者自由修改使用。但旗舰版本仅通过API接口和付费托管服务提供,同时对年营收超百万美元的企业用户实施商业授权制度,该金额按当前汇率折合约682.1万元人民币。
为确保数据合法性,公司提前布局版权合作网络。去年已与华纳音乐集团、环球音乐集团建立战略伙伴关系,所有训练数据均通过正式授权渠道获取。这种前瞻性布局有效规避了行业常见的版权争议风险,为模型商业化铺平道路。
专业音乐市场成为新的战略焦点。企业正在秘密研发面向音乐人的专业工具链,具体功能尚未对外披露。为推进该产品线开发,前环球音频首席数字官伊桑·卡普兰已正式加盟,这位拥有丰富行业经验的资深管理者将主导专业音乐产品的战略规划与业务拓展。此次人事任命显示公司深耕音乐产业的坚定决心,其后续产品动态值得持续关注。






