阿里通义千问发布全新TTS模型:49种音色、支持多语种与方言

2025-12-11 16:48:18   |   棠糖   |   1316

12月11日,阿里云旗下通义千问正式发布其新一代语音合成模型Qwen3-TTS。该模型不仅拥有超过49种不同风格的音色选择,还支持包括汉语、英语、日语、韩语等在内的10种主流语言,并能模拟包括粤语、四川话、闽南语等多种方言,显著提升了语音合成的多样性与表现力。

Qwen3-TTS在音色库上进行了大幅扩展,覆盖不同年龄、性别与角色设定。用户可选择如“撒娇搞怪-茉兔”“傲娇率性-十三”“智慧老者-沧明子”等各具特色的声音,满足从有声读物、虚拟助手到影视配音等多种场景的需求。

在多语言与方言支持方面,该模型不仅涵盖中文、英文、日语等常用语种,还进一步强化了对闽南语、吴语、粤语等地方口音的模拟能力。官方测试显示,其在多项多语种数据集上的词错误率表现优于多个国际主流TTS模型。

据官方介绍,相比前代版本,Qwen3-TTS在语音的韵律节奏与语速调节上取得显著进步,能够更自然地根据文本内容调整表达方式,拟人化程度大幅提升,更贴近真人发声。目前该模型已通过通义千问API对外开放使用。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺,请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时发送相关信息至bireading@163.com,本站将会在48小时内处理完毕。

阿里通义千问发布全新TTS模型:49种音色、支持多语种与方言

2025-12-11 16:48:18 浏览量: 1316 作者: 棠糖

12月11日,阿里云旗下通义千问正式发布其新一代语音合成模型Qwen3-TTS。该模型不仅拥有超过49种不同风格的音色选择,还支持包括汉语、英语、日语、韩语等在内的10种主流语言,并能模拟包括粤语、四川话、闽南语等多种方言,显著提升了语音合成的多样性与表现力。

Qwen3-TTS在音色库上进行了大幅扩展,覆盖不同年龄、性别与角色设定。用户可选择如“撒娇搞怪-茉兔”“傲娇率性-十三”“智慧老者-沧明子”等各具特色的声音,满足从有声读物、虚拟助手到影视配音等多种场景的需求。

在多语言与方言支持方面,该模型不仅涵盖中文、英文、日语等常用语种,还进一步强化了对闽南语、吴语、粤语等地方口音的模拟能力。官方测试显示,其在多项多语种数据集上的词错误率表现优于多个国际主流TTS模型。

据官方介绍,相比前代版本,Qwen3-TTS在语音的韵律节奏与语速调节上取得显著进步,能够更自然地根据文本内容调整表达方式,拟人化程度大幅提升,更贴近真人发声。目前该模型已通过通义千问API对外开放使用。

,

Copyright ©2018 铋读网 All Rights Reserved.

京ICP备18051707号

京公网安备 11011302001633号