阿里发布Qwen3.7-Plus模型:多模态交互混合智能体,Vision Arena助阿里进入全球前5
6月2日,阿里千问大模型今日发布博文,宣布推出Qwen3.7-Plus模型,定位为多模态交互混合智能体。该模型是Qwen3.7的多模态升级版,核心定位是视觉与语言统一的智能体基座。它保留了文本、编码、工具使用和生产力工作流能力,同时强化了视觉理解、视觉推理和跨模态任务处理。模型已通过阿里云百炼提供服务,也可在Qwen Studio体验。它支持图像、视频、屏幕、网页和文本输入,面向复杂软件与办公流程,可在GUI、CLI和工具环境中完成任务。
在模型表现上,Qwen3.7-Plus凭借Vision Arena成绩帮助阿里进入全球前5、中国第1。纯文本测试中,它接近Max级别模型,在编码智能体、通用智能体、推理、指令遵循和多语言任务上保持强表现。多模态测试显示,该模型强化了视觉推理、工具调用和任务执行链路,在BabyVision、MathVision、ScreenSpot Pro、OSWorld-Verified、AndroidWorld等评测中提升明显。