蚂蚁集团开源全球首个万亿参数推理大模型,多项表现超越GPT-5
9月30日,蚂蚁集团宣布开源其自主研发的首个万亿参数大模型Ring-1T-preview。该模型是全球开源领域首个达到万亿参数规模的推理大模型,在多项权威测试中展现出卓越的自然语言推理与代码生成能力,部分指标已超越GPT-5。
根据官方公布的数据,Ring-1T-preview在AIME 25测试中获得92.6分,不仅超越所有已知开源模型及Gemini 2.5 Pro,更接近GPT-5(无工具使用)94.6分的表现。在CodeForces测试中,该模型以94.69分的成绩实现对GPT-5的反超。此外,在LiveCodeBench与ARC-AGI-v1等基准评测中,Ring-1T-preview均位列开源模型首位。
蚂蚁百灵研发团队透露,该模型在国际奥林匹克数学竞赛(IMO25)测试中可一次性解答出第三题,并在其余题目中部分答对,显示出较强的复杂推理潜力。目前,Ring-1T正式版仍在训练中,团队持续基于Ling2.0家族的万亿参数基座进行后训练,以进一步挖掘模型潜力。