阿里通义千问发布全新TTS模型：49种音色、支持多语种与方言

2025-12-11 16:48:18 | 棠糖 | 1347

12月11日，阿里云旗下通义千问正式发布其新一代语音合成模型Qwen3-TTS。该模型不仅拥有超过49种不同风格的音色选择，还支持包括汉语、英语、日语、韩语等在内的10种主流语言，并能模拟包括粤语、四川话、闽南语等多种方言，显著提升了语音合成的多样性与表现力。

Qwen3-TTS在音色库上进行了大幅扩展，覆盖不同年龄、性别与角色设定。用户可选择如“撒娇搞怪-茉兔”“傲娇率性-十三”“智慧老者-沧明子”等各具特色的声音，满足从有声读物、虚拟助手到影视配音等多种场景的需求。

在多语言与方言支持方面，该模型不仅涵盖中文、英文、日语等常用语种，还进一步强化了对闽南语、吴语、粤语等地方口音的模拟能力。官方测试显示，其在多项多语种数据集上的词错误率表现优于多个国际主流TTS模型。

据官方介绍，相比前代版本，Qwen3-TTS在语音的韵律节奏与语速调节上取得显著进步，能够更自然地根据文本内容调整表达方式，拟人化程度大幅提升，更贴近真人发声。目前该模型已通过通义千问API对外开放使用。

特别提醒：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺，请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益，请及时发送相关信息至bireading@163.com，本站将会在48小时内处理完毕。