阿里通义千问推出全新推理模型 Qwen3-30B-A3B-Thinking-2507，多项能力显著提升

2025-07-31 10:37:20 | 唐薇 | 1038

7月31日，阿里通义千问今日宣布推出全新推理模型 Qwen3-30B-A3B-Thinking-2507。相较于 4 月 29 日开源的 Qwen3-30-A3B 模型，新模型在推理能力、通用能力及上下文长度上有了显著提升。

新模型在聚焦数学能力的 AIME25 评测中斩获 85.0 的高分，在代码能力测试 LiveCodeBench v6 中得分 66.0，两项核心推理能力均超越 Gemini2.5-Flash（thinking）、Qwen3-235B-A22B（thinking）；新模型的知识水平（GPQA、MMLU-Pro）也较上一版本进步显著。

在写作（WritingBench）、Agent 能力（BFCL-v3）、多轮对话和多语言指令遵循（MultiIF）等通用能力评测中，Qwen3-30B-A3B-Thinking-2507 均超越 Gemini2.5-Flash（thinking）、Qwen3-235B-A22B（thinking）。

此外，新模型的思考长度（thinking length）也增加了，官方推荐在高度复杂的推理任务中设置更长的思考预算，以充分发挥它的潜力。官方透露，目前 Qwen3-30B-A3B-Thinking-2507 已在魔搭社区、HuggingFace 上开源，其轻量体积可轻松实现消费级硬件的本地部署；同时，其也在 Qwen Chat 上同步上线了新模型。

特别提醒：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺，请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益，请及时发送相关信息至bireading@163.com，本站将会在48小时内处理完毕。