阿里发布 Qwen3-Omni-Flash 全模态大模型,甜妹、御姐等 AI 人设风格任你选

2025-12-11 16:58:59   |   探索者   |   1409

12月11日,据报道,阿里 Qwen 团队于 2025 年 12 月 9 日发布博文,宣布推出新一代原生全模态大模型 Qwen3-Omni-Flash-2025-12-01,该模型在 Qwen3-Omni 基础上进行了全面升级,支持文本、图像、音视频的无缝输入与实时流式输出。该模型不仅能无缝处理文本、图像、音频和视频等多种输入形式,还能通过实时流式响应,同步生成高质量的文本与自然语音。

作为 Qwen3-Omni 的全面升级版,新模型在保持高效响应的同时,着重解决了此前多模态交互中存在的痛点,致力于实现“声形意合,令出智随”的极致体验。针对口语化场景中常见的“降智”问题,Qwen3-Omni-Flash 大幅增强了对音视频指令的理解与执行能力。新模型显著提升了多轮对话的稳定性与连贯性,彻底告别了以往语音生成中语速拖沓、机械呆板的现象。

现在,模型能根据文本内容自适应调节语速、停顿与韵律,其语音表现的自然度与拟人化程度已逼近真人水平,为用户带来更流畅的对话体验。此次升级最引人注目的功能是系统提示(System Prompt)控制能力的飞跃。Qwen 团队全面开放了 System Prompt 自定义权限,用户可以精细调控模型的行为模式 —— 无论是设定“甜妹”、“御姐”或“日系”等特定人设风格,还是调整口语化表达偏好及回复长度,模型均能精准执行。

此外,模型的多语言能力也更加可靠,支持 119 种文本语言交互、19 种语音识别语言及 10 种语音合成语言,确保在跨语言场景下响应准确一致。

在客观性能指标上,Qwen3-Omni-Flash-2025-12-01 展现了强大的统治力。数据显示,该模型在逻辑推理任务(ZebraLogic)上得分提升 5.6,在代码生成(LiveCodeBench-v6)上提升 9.3,在多学科视觉问答(MMMU)上提升 4.7。这些数据表明,新模型不仅能更准确地“看懂”图像与视频内容,还在复杂指令遵循与深度逻辑分析上迈上了新台阶。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺,请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时发送相关信息至bireading@163.com,本站将会在48小时内处理完毕。

阿里发布 Qwen3-Omni-Flash 全模态大模型,甜妹、御姐等 AI 人设风格任你选

2025-12-11 16:58:59 浏览量: 1409 作者: 探索者

12月11日,据报道,阿里 Qwen 团队于 2025 年 12 月 9 日发布博文,宣布推出新一代原生全模态大模型 Qwen3-Omni-Flash-2025-12-01,该模型在 Qwen3-Omni 基础上进行了全面升级,支持文本、图像、音视频的无缝输入与实时流式输出。该模型不仅能无缝处理文本、图像、音频和视频等多种输入形式,还能通过实时流式响应,同步生成高质量的文本与自然语音。

作为 Qwen3-Omni 的全面升级版,新模型在保持高效响应的同时,着重解决了此前多模态交互中存在的痛点,致力于实现“声形意合,令出智随”的极致体验。针对口语化场景中常见的“降智”问题,Qwen3-Omni-Flash 大幅增强了对音视频指令的理解与执行能力。新模型显著提升了多轮对话的稳定性与连贯性,彻底告别了以往语音生成中语速拖沓、机械呆板的现象。

现在,模型能根据文本内容自适应调节语速、停顿与韵律,其语音表现的自然度与拟人化程度已逼近真人水平,为用户带来更流畅的对话体验。此次升级最引人注目的功能是系统提示(System Prompt)控制能力的飞跃。Qwen 团队全面开放了 System Prompt 自定义权限,用户可以精细调控模型的行为模式 —— 无论是设定“甜妹”、“御姐”或“日系”等特定人设风格,还是调整口语化表达偏好及回复长度,模型均能精准执行。

此外,模型的多语言能力也更加可靠,支持 119 种文本语言交互、19 种语音识别语言及 10 种语音合成语言,确保在跨语言场景下响应准确一致。

在客观性能指标上,Qwen3-Omni-Flash-2025-12-01 展现了强大的统治力。数据显示,该模型在逻辑推理任务(ZebraLogic)上得分提升 5.6,在代码生成(LiveCodeBench-v6)上提升 9.3,在多学科视觉问答(MMMU)上提升 4.7。这些数据表明,新模型不仅能更准确地“看懂”图像与视频内容,还在复杂指令遵循与深度逻辑分析上迈上了新台阶。

,

Copyright ©2018 铋读网 All Rights Reserved.

京ICP备18051707号

京公网安备 11011302001633号