阿里千问3.5-Max-Preview亮相LM Arena:1464分升至中国公司第一
3月20日,阿里千问大模型家族今日迎来新成员——Qwen3.5-Max-Preview作为千问3.5系列的旗舰模型预览版,在全球大模型竞技平台LM Arena正式亮相,并获得1464分的综合得分。凭借这一成绩,阿里千问在LM Arena全球大模型公司排行榜中的排名上升至全球第五位,位列中国公司首位。
据阿里云介绍,LM Arena是由国际开源研究机构LMSYS组织的第三方大模型评测平台,其评测机制采用模型两两匿名对战,由全球开发者进行盲测投票,最终根据胜负结果形成模型分数与排名。由于采用开放式对战与人工评估相结合的方式,该榜单被业界视为当前最具参考价值的大模型性能评测之一。
在本次评测中,Qwen3.5-Max-Preview在没有风格控制的绝对胜率比拼中,整体性能排名全球第六。在细分任务层面,该模型的数学能力排名全球第五,专家级文本处理能力排名全球第十。此次亮相也是千问3.5系列首次以旗舰级模型身份参与国际第三方评测。
自除夕以来,阿里千问今年已陆续开源Qwen3.5系列的多款模型,覆盖从0.8B到397B共8种不同参数规模,各尺寸模型均在同参数量级上取得领先性能。其中,Qwen3.5-Plus采用总参数3970亿、激活参数170亿的架构设计,以较小的激活参数实现了优于部分参数量更大模型的性能表现。此次亮相的Qwen3.5-Max-Preview是该系列旗舰模型的预览版本,后续将根据社区反馈持续优化迭代。从1464分到中国公司第一,阿里千问正以旗舰模型实力在国际竞技场中证明自己。