谷歌发布Gemini 3.1 Flash-Lite:速度最快、成本最低的轻量级AI模型

2026-03-04 09:59:38   |   弘乐   |   1308

3月4日,谷歌发布轻量级AI模型Gemini 3.1 Flash-Lite,声称是其速度最快、最具成本效益的Gemini 3系列模型。开发者即日起可通过Google AI Studio中的Gemini API获取预览版,企业级用户可在Vertex AI平台同步体验。

谷歌为该模型制定了极具竞争力的价格:每百万输入Tokens收费0.25美元,每百万输出Tokens为1.50美元。这一定价策略旨在大幅降低AI应用的开发与部署门槛。

在低售价的同时,Gemini 3.1 Flash-Lite实现性能大幅跨越。权威评测平台Artificial Analysis数据显示,与前代2.5 Flash相比,新模型的首字响应速度提升2.5倍,整体输出速度同步提升45%,极低延迟特性使其成为构建实时响应体验的理想选择。

在各项核心能力测试中,3.1 Flash-Lite展现出越级实力。该模型在Arena.ai排行榜斩获1432分Elo得分,在GPQA Diamond测试中得分率高达86.9%,在MMMU Pro测试中达到76.8%,多项指标超越体积更大的上一代Gemini 2.5 Flash模型。

新模型在AI Studio和Vertex AI中标配了创新的“思考层级”功能,支持开发者灵活控制模型执行任务时的“思考深度”。在处理海量翻译或内容审核等基础任务时,可调低深度追求极致效率;在生成用户界面、构建数据看板或复杂逻辑模拟等高难度任务时,则可调高层级激发更深层推理能力。

Latitude、Cartwheel及Whering等早期测试企业已率先将3.1 Flash-Lite部署于复杂业务场景。测试团队反馈称,该模型不仅具备卓越的处理效率和逻辑推理能力,还能以媲美大型模型的精准度处理复杂输入指令。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺,请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时发送相关信息至bireading@163.com,本站将会在48小时内处理完毕。

谷歌发布Gemini 3.1 Flash-Lite:速度最快、成本最低的轻量级AI模型

2026-03-04 09:59:38 浏览量: 1308 作者: 弘乐

3月4日,谷歌发布轻量级AI模型Gemini 3.1 Flash-Lite,声称是其速度最快、最具成本效益的Gemini 3系列模型。开发者即日起可通过Google AI Studio中的Gemini API获取预览版,企业级用户可在Vertex AI平台同步体验。

谷歌为该模型制定了极具竞争力的价格:每百万输入Tokens收费0.25美元,每百万输出Tokens为1.50美元。这一定价策略旨在大幅降低AI应用的开发与部署门槛。

在低售价的同时,Gemini 3.1 Flash-Lite实现性能大幅跨越。权威评测平台Artificial Analysis数据显示,与前代2.5 Flash相比,新模型的首字响应速度提升2.5倍,整体输出速度同步提升45%,极低延迟特性使其成为构建实时响应体验的理想选择。

在各项核心能力测试中,3.1 Flash-Lite展现出越级实力。该模型在Arena.ai排行榜斩获1432分Elo得分,在GPQA Diamond测试中得分率高达86.9%,在MMMU Pro测试中达到76.8%,多项指标超越体积更大的上一代Gemini 2.5 Flash模型。

新模型在AI Studio和Vertex AI中标配了创新的“思考层级”功能,支持开发者灵活控制模型执行任务时的“思考深度”。在处理海量翻译或内容审核等基础任务时,可调低深度追求极致效率;在生成用户界面、构建数据看板或复杂逻辑模拟等高难度任务时,则可调高层级激发更深层推理能力。

Latitude、Cartwheel及Whering等早期测试企业已率先将3.1 Flash-Lite部署于复杂业务场景。测试团队反馈称,该模型不仅具备卓越的处理效率和逻辑推理能力,还能以媲美大型模型的精准度处理复杂输入指令。

,

Copyright ©2018 铋读网 All Rights Reserved.

京ICP备18051707号

京公网安备 11011302001633号