阿里发布千问旗舰推理模型 Qwen3-Max-Thinking:总参数超万亿
1月26日,据阿里发布千问旗舰推理模型 Qwen3-Max-Thinking。根据官方介绍,其在多个关键维度上实现了显著提升,包括事实知识、复杂推理、指令遵循、人类偏好对齐以及智能体能力。在 19 项权威基准测试中,其性能可媲美 GPT-5.2-Thinking、Claude-Opus-4.5 和 Gemini 3 Pro 等顶尖模型。
千问新模型总参数超万亿,进行了更大规模的强化学习后训练,并通过推理技术的系列创新,最终完成模型性能的大幅飞跃。在多项关键性能基准测试中,Qwen3-Max-Thinking 还大幅增强了自主调用工具的原生 Agent 能力,模型可像专业人士一样边用工具边思考,回答更合用户心意、更智能、更流畅。同时,模型幻觉也大为降低,为解决真实复杂任务打下基础。
根据官方介绍,Qwen3-Max-Thinking 刷新了数项最佳表现(SOTA)纪录,特别在科学知识(GPQA Diamond)、数学推理(IMO-AnswerBench)、代码编程(LiveCodeBench)等多项关键性能基准测试中表现优异,达到国际领先水平。
Qwen3-Max-Thinking 现已上线 Qwen Chat,用户可直接与模型及其自适应工具调用功能进行交互。同时,Qwen3-Max-Thinking 的 API(模型名称为 qwen3-max-2026-01-23)也已开放。