蚂蚁集团开源全球首个万亿参数推理大模型,多项表现超越GPT-5

2025-09-30 15:58:00   |   唐薇   |   1527

9月30日,蚂蚁集团宣布开源其自主研发的首个万亿参数大模型Ring-1T-preview。该模型是全球开源领域首个达到万亿参数规模的推理大模型,在多项权威测试中展现出卓越的自然语言推理与代码生成能力,部分指标已超越GPT-5。

根据官方公布的数据,Ring-1T-preview在AIME 25测试中获得92.6分,不仅超越所有已知开源模型及Gemini 2.5 Pro,更接近GPT-5(无工具使用)94.6分的表现。在CodeForces测试中,该模型以94.69分的成绩实现对GPT-5的反超。此外,在LiveCodeBench与ARC-AGI-v1等基准评测中,Ring-1T-preview均位列开源模型首位。

蚂蚁百灵研发团队透露,该模型在国际奥林匹克数学竞赛(IMO25)测试中可一次性解答出第三题,并在其余题目中部分答对,显示出较强的复杂推理潜力。目前,Ring-1T正式版仍在训练中,团队持续基于Ling2.0家族的万亿参数基座进行后训练,以进一步挖掘模型潜力。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺,请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时发送相关信息至bireading@163.com,本站将会在48小时内处理完毕。

蚂蚁集团开源全球首个万亿参数推理大模型,多项表现超越GPT-5

2025-09-30 15:58:00 浏览量: 1527 作者: 唐薇

9月30日,蚂蚁集团宣布开源其自主研发的首个万亿参数大模型Ring-1T-preview。该模型是全球开源领域首个达到万亿参数规模的推理大模型,在多项权威测试中展现出卓越的自然语言推理与代码生成能力,部分指标已超越GPT-5。

根据官方公布的数据,Ring-1T-preview在AIME 25测试中获得92.6分,不仅超越所有已知开源模型及Gemini 2.5 Pro,更接近GPT-5(无工具使用)94.6分的表现。在CodeForces测试中,该模型以94.69分的成绩实现对GPT-5的反超。此外,在LiveCodeBench与ARC-AGI-v1等基准评测中,Ring-1T-preview均位列开源模型首位。

蚂蚁百灵研发团队透露,该模型在国际奥林匹克数学竞赛(IMO25)测试中可一次性解答出第三题,并在其余题目中部分答对,显示出较强的复杂推理潜力。目前,Ring-1T正式版仍在训练中,团队持续基于Ling2.0家族的万亿参数基座进行后训练,以进一步挖掘模型潜力。

,

Copyright ©2018 铋读网 All Rights Reserved.

京ICP备18051707号

京公网安备 11011302001633号