字节跳动发布Seed Prover 1.5数学推理模型,IMO题目证明达到金牌水平

2025-12-24 17:46:11   |   棠糖   |   1384

12月24日,据报道,字节跳动Seed团队今日正式推出新一代形式化数学推理专用模型Seed Prover 1.5。该模型通过大规模Agentic RL强化学习训练,在数学问题推理能力与效率上实现显著突破,不仅在多项国际数学竞赛题目上表现出色,更在部分难度评测中刷新了当前最优性能记录。

测试数据显示,Seed Prover 1.5在16.5小时内针对2025年国际数学奥林匹克竞赛前五道题目,生成了完整可编译验证的Lean证明代码,换算成绩达到35/42分,超过IMO金牌分数线。在北美本科级别数学竞赛Putnam 2025的12道赛题中,该模型用时9小时,对其中的11道题生成了可验证的Lean代码。

在更系统的评估体系中,Seed Prover 1.5在完整的Putnam历史题目集上解决了88%的问题;在代表硕士数学难度的Fate-H评估集上解决了80%的题目;在代表博士数学难度的Fate-X评估集上解决了33%的题目,这三项成绩均创造了当前形式化数学推理模型在这些评测中的最佳表现。

字节跳动表示,已对外公开Seed Prover 1.5的技术报告,并计划后续开放API接口,供研究者和开发者进一步探索与应用。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺,请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时发送相关信息至bireading@163.com,本站将会在48小时内处理完毕。

字节跳动发布Seed Prover 1.5数学推理模型,IMO题目证明达到金牌水平

2025-12-24 17:46:11 浏览量: 1384 作者: 棠糖

12月24日,据报道,字节跳动Seed团队今日正式推出新一代形式化数学推理专用模型Seed Prover 1.5。该模型通过大规模Agentic RL强化学习训练,在数学问题推理能力与效率上实现显著突破,不仅在多项国际数学竞赛题目上表现出色,更在部分难度评测中刷新了当前最优性能记录。

测试数据显示,Seed Prover 1.5在16.5小时内针对2025年国际数学奥林匹克竞赛前五道题目,生成了完整可编译验证的Lean证明代码,换算成绩达到35/42分,超过IMO金牌分数线。在北美本科级别数学竞赛Putnam 2025的12道赛题中,该模型用时9小时,对其中的11道题生成了可验证的Lean代码。

在更系统的评估体系中,Seed Prover 1.5在完整的Putnam历史题目集上解决了88%的问题;在代表硕士数学难度的Fate-H评估集上解决了80%的题目;在代表博士数学难度的Fate-X评估集上解决了33%的题目,这三项成绩均创造了当前形式化数学推理模型在这些评测中的最佳表现。

字节跳动表示,已对外公开Seed Prover 1.5的技术报告,并计划后续开放API接口,供研究者和开发者进一步探索与应用。

,

Copyright ©2018 铋读网 All Rights Reserved.

京ICP备18051707号

京公网安备 11011302001633号