阿里通义千问更新 Qwen3-30B 非思考模型 AI 性能媲美 GPT-4o

2025-07-30 10:36:59 | 文白不白 | 1365

7月30日，阿里通义千问在 X 平台发布推文，宣布推出 Qwen3-30B-A3B 非思考模式的更新版本，命名为 Qwen3-30B-A3B-Instruct-2507。新模型主要提升指令跟随、逻辑推理、文本理解、数学、科学、编程和工具使用等通用能力，官方表示在激活 3B 参数的情况下，性能接近 GPT-4o 和 Qwen3-235B-A22B Non-Thinking。

据报道，Qwen3-30B-A3B-Instruct-2507 模型的参数总量为 305 亿，但激活参数为 33 亿，非嵌入层数量为 299 亿，网络层数为 48 层，专家数为 128 个，激活专家数为 8 个，上下文长度原生支持 262144 个 tokens。

该模型仅支持非思考模式，在输出中不会生成 <think></think> 块。同时，不再需要指定 enable_thinking=False。官方表示新模型大幅增加了多种语言的长尾知识覆盖，且在主观和开放式任务中与用户偏好更加一致，能够提供更有帮助的回答和更高质量的文本生成。

特别提醒：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺，请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益，请及时发送相关信息至bireading@163.com，本站将会在48小时内处理完毕。