阿里通义千问发布全新TTS模型:49种音色、支持多语种与方言
12月11日,阿里云旗下通义千问正式发布其新一代语音合成模型Qwen3-TTS。该模型不仅拥有超过49种不同风格的音色选择,还支持包括汉语、英语、日语、韩语等在内的10种主流语言,并能模拟包括粤语、四川话、闽南语等多种方言,显著提升了语音合成的多样性与表现力。
Qwen3-TTS在音色库上进行了大幅扩展,覆盖不同年龄、性别与角色设定。用户可选择如“撒娇搞怪-茉兔”“傲娇率性-十三”“智慧老者-沧明子”等各具特色的声音,满足从有声读物、虚拟助手到影视配音等多种场景的需求。
在多语言与方言支持方面,该模型不仅涵盖中文、英文、日语等常用语种,还进一步强化了对闽南语、吴语、粤语等地方口音的模拟能力。官方测试显示,其在多项多语种数据集上的词错误率表现优于多个国际主流TTS模型。
据官方介绍,相比前代版本,Qwen3-TTS在语音的韵律节奏与语速调节上取得显著进步,能够更自然地根据文本内容调整表达方式,拟人化程度大幅提升,更贴近真人发声。目前该模型已通过通义千问API对外开放使用。