阿里云发布万亿参数模型Qwen3-Max,代码与智能体能力实现行业领先

2025-09-24 11:42:08   |   微观猎人   |   1279

9月24日,阿里云正式推出通义千问系列迄今规模最大、能力最强的语言模型Qwen3-Max。该模型总参数超过1万亿,预训练数据量达36T tokens,在知识、推理、编程、智能体任务等全方位基准测试中均达到业界顶尖水平。

Qwen3-Max-Instruct正式版在代码生成与智能体能力上表现尤为突出。在现实编程挑战基准SWE-Bench Verified中取得69.6分,位列全球顶尖模型阵营;在工具调用能力测试Tau2-Bench上以74.8分超越Claude Opus 4与DeepSeek-V3.1。其预览版此前已在LMArena文本排行榜稳居全球前三,正式版进一步优化了性能。

值得关注的是,仍在训练中的推理增强版本Qwen3-Max-Thinking已展现出突破性潜力。该版本结合代码解释器与并行测试时计算,在AIME 25、HMMT等高难度数学推理测试中实现100%准确率,预计将在不久后向公众发布。

技术方面,Qwen3-Max沿用MoE架构,训练过程稳定高效,在PAI-FlashMoE优化下训练效率较Qwen2.5-Max提升30%,并支持1M长上下文训练。模型已通过QwenChat平台及阿里云百炼平台开放服务。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺,请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时发送相关信息至bireading@163.com,本站将会在48小时内处理完毕。

阿里云发布万亿参数模型Qwen3-Max,代码与智能体能力实现行业领先

2025-09-24 11:42:08 浏览量: 1279 作者: 微观猎人

9月24日,阿里云正式推出通义千问系列迄今规模最大、能力最强的语言模型Qwen3-Max。该模型总参数超过1万亿,预训练数据量达36T tokens,在知识、推理、编程、智能体任务等全方位基准测试中均达到业界顶尖水平。

Qwen3-Max-Instruct正式版在代码生成与智能体能力上表现尤为突出。在现实编程挑战基准SWE-Bench Verified中取得69.6分,位列全球顶尖模型阵营;在工具调用能力测试Tau2-Bench上以74.8分超越Claude Opus 4与DeepSeek-V3.1。其预览版此前已在LMArena文本排行榜稳居全球前三,正式版进一步优化了性能。

值得关注的是,仍在训练中的推理增强版本Qwen3-Max-Thinking已展现出突破性潜力。该版本结合代码解释器与并行测试时计算,在AIME 25、HMMT等高难度数学推理测试中实现100%准确率,预计将在不久后向公众发布。

技术方面,Qwen3-Max沿用MoE架构,训练过程稳定高效,在PAI-FlashMoE优化下训练效率较Qwen2.5-Max提升30%,并支持1M长上下文训练。模型已通过QwenChat平台及阿里云百炼平台开放服务。

,

Copyright ©2018 铋读网 All Rights Reserved.

京ICP备18051707号

京公网安备 11011302001633号