谷歌Gemini 2.5 Pro模型再升级:性能跑分刷新纪录
6月6日,谷歌近日对其AI模型Gemini 2.5 Pro进行了新一轮更新,将其预览版升级至06-05版本,并宣布该版本在多项AI基准测试中表现显著提升。与此同时,谷歌还回应了此前用户对模型性能波动的反馈,优化了生成内容的风格与结构,进一步提升了交互体验。
根据谷歌官方数据,更新后的Gemini 2.5 Pro在多个AI评测基准中刷新了成绩:LMArena Elo评分提升24分,显示模型在语言理解与生成能力上的进步。WebDevArena Elo评分大幅上涨35分,达到1443分,谷歌称这一成绩已达到“业界领先水平”。在GPQA(通用问题回答基准)和Humanity's Last Exam等高难度测试中,新版模型也展现出更强的推理与问题解决能力。
此次更新距离谷歌3月底发布Gemini 2.5 Pro仅过去两个多月,而轻量级版本Gemini 2.5 Flash也已在4月面向全球用户开放体验。尽管两款模型仍处于预览阶段,但频繁的迭代显示出谷歌在AI赛道上的加速布局。
针对此前用户反馈的“模型性能短暂下滑”问题,谷歌表示,新版Gemini 2.5 Pro已在创意生成和回答格式上进行了优化,使输出内容更具结构性,同时提升了交互流畅度。