Stability AI发布Stability Audio 3.0：可生成长达6分钟专业级音乐，开源三款模型

2026-05-21 08:11:10 | 弘乐 | 150

5月21日，据外媒TechCrunch报道，AI初创公司Stability AI推出全新音频生成模型家族Stability Audio 3.0，其顶级版本据称可生成长达六分钟以上的专业级音乐。

此次共推出四款不同规格的模型：4.59亿参数的小型SFX版、小型版、14亿参数的中型版，以及27亿参数的大型版。其中，两款小型模型专注于设备端运行，可本地生成两分钟以内的声音与音乐。中型和大型模型则展现出更强的架构控制力，能够创作长达6分20秒的完整乐曲，并精准维持音乐结构与旋律基调。这一长度较2024年推出的Stable Audio 2.0实现了翻倍以上的跨越。

为回馈开源社区，Stability AI已将小型SFX、小型及中型模型开源，公众可自由下载并修改权重。最顶尖的大型模型目前仅通过API与付费托管服务提供，年营收超过100万美元的企业必须购买商业授权。为规避合规风险，Stability AI去年已与华纳音乐集团、环球音乐集团达成深度合作，强调此次最新音频模型全量基于合法授权的数据集训练而成。

Stability AI目前正为专业音乐人打造一套全新产品线，尚未公布具体功能细节。为推进该项目，曾先后担任环球音频与芬达首席数字官的伊桑·卡普兰已正式加盟，负责领衔专业音乐产品业务。

特别提醒：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺，请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益，请及时发送相关信息至bireading@163.com，本站将会在48小时内处理完毕。