阿里通义千问 Qwen3-4B-2507 双料更新 手机也能轻松跑

2025-08-07 11:20:32   |   探索者   |   1324

8月7日,通义千问 Qwen 发布公告,宣布推出 Qwen3-4B-Instruct-2507 和 Qwen3-4B-Thinking-2507 两个模型,大幅提升性能。官方表示,SLM(Small Language Models)对 Agentic AI 的发展极具价值,“2507”版本的 Qwen3-4B 模型,体积小,性能强,对手机等端侧硬件部署尤为友好。

据报道,在非推理(non-thinking)领域,Qwen3-4B-Instruct-2507 显著提升通用能力,目标成为更全能的端侧利器。该模型掌握更多语言和长尾知识,上下文理解扩展至 256K,小模型也能处理长文本。该模型通用能力超越了闭源的小尺寸模型 GPT-4.1-nano,性能接近等规模的 Qwen3-30B-A3B(non-thinking)。官方表示该模型更像一位高效的“执行专家”,遵循指令、迅速响应,更适合用于内容创作、工具调用等。

在推理(thinking)领域,Qwen3-4B-Thinking-2507 大幅提升了推理能力,AIME25 高达 81.3 分。Qwen3-4B-Thinking-2507 的推理表现可媲美中等模型 Qwen3-30B-Thinking,在聚焦数学能力的 AIME25 测评中,以 4B 参数量斩获惊人的 81.3 分的好成绩。官方表示该模型像一位严谨的“学术专家”,面对复杂问题逐步推理,完成任务更深入可靠。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺,请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时发送相关信息至bireading@163.com,本站将会在48小时内处理完毕。

阿里通义千问 Qwen3-4B-2507 双料更新 手机也能轻松跑

2025-08-07 11:20:32 浏览量: 1324 作者: 探索者

8月7日,通义千问 Qwen 发布公告,宣布推出 Qwen3-4B-Instruct-2507 和 Qwen3-4B-Thinking-2507 两个模型,大幅提升性能。官方表示,SLM(Small Language Models)对 Agentic AI 的发展极具价值,“2507”版本的 Qwen3-4B 模型,体积小,性能强,对手机等端侧硬件部署尤为友好。

据报道,在非推理(non-thinking)领域,Qwen3-4B-Instruct-2507 显著提升通用能力,目标成为更全能的端侧利器。该模型掌握更多语言和长尾知识,上下文理解扩展至 256K,小模型也能处理长文本。该模型通用能力超越了闭源的小尺寸模型 GPT-4.1-nano,性能接近等规模的 Qwen3-30B-A3B(non-thinking)。官方表示该模型更像一位高效的“执行专家”,遵循指令、迅速响应,更适合用于内容创作、工具调用等。

在推理(thinking)领域,Qwen3-4B-Thinking-2507 大幅提升了推理能力,AIME25 高达 81.3 分。Qwen3-4B-Thinking-2507 的推理表现可媲美中等模型 Qwen3-30B-Thinking,在聚焦数学能力的 AIME25 测评中,以 4B 参数量斩获惊人的 81.3 分的好成绩。官方表示该模型像一位严谨的“学术专家”,面对复杂问题逐步推理,完成任务更深入可靠。

,

Copyright ©2018 铋读网 All Rights Reserved.

京ICP备18051707号

京公网安备 11011302001633号