通义千问Qwen3-Max上线“深度思考”模式,突破AI复杂推理瓶颈
11月3日,据报道,阿里云通义千问旗下最新旗舰模型Qwen3-Max正式推出“深度思考”模式,这一突破性功能通过强化模型的推理链分析与多步骤问题拆解能力,使其在处理复杂任务时的效率得到显著提升。
作为通义团队于9月24日发布的迄今规模最大、能力最强的语言模型,Qwen3-Max不仅在参数量上突破万亿大关,其预训练数据规模也达到了惊人的36T tokens。这一技术底座为其卓越的性能表现奠定了坚实基础。
在能力表现方面,Qwen3-Max-Instruct正式版在代码生成与智能体任务执行上实现了进一步突破。该模型在涵盖知识问答、逻辑推理、编程实践、指令理解、人类价值对齐以及多语言理解等多个维度的基准测试中,均展现出业界领先的综合实力。
尤为值得关注的是,通义团队此前披露的测试结果显示,具备“深度思考”能力的Qwen3-Max-Thinking版本,在结合工具使用并增强测试时计算资源配置后,已在AIME 25、HMMT等高难度数学推理基准测试中取得了100%的准确率。这一成绩不仅彰显了模型在复杂推理场景下的卓越表现,也为大语言模型在专业领域的深入应用开辟了新的可能性。