谷歌发布Gemini 3.1 Flash-Lite:速度最快、成本最低的轻量级AI模型
3月4日,谷歌发布轻量级AI模型Gemini 3.1 Flash-Lite,声称是其速度最快、最具成本效益的Gemini 3系列模型。开发者即日起可通过Google AI Studio中的Gemini API获取预览版,企业级用户可在Vertex AI平台同步体验。
谷歌为该模型制定了极具竞争力的价格:每百万输入Tokens收费0.25美元,每百万输出Tokens为1.50美元。这一定价策略旨在大幅降低AI应用的开发与部署门槛。
在低售价的同时,Gemini 3.1 Flash-Lite实现性能大幅跨越。权威评测平台Artificial Analysis数据显示,与前代2.5 Flash相比,新模型的首字响应速度提升2.5倍,整体输出速度同步提升45%,极低延迟特性使其成为构建实时响应体验的理想选择。
在各项核心能力测试中,3.1 Flash-Lite展现出越级实力。该模型在Arena.ai排行榜斩获1432分Elo得分,在GPQA Diamond测试中得分率高达86.9%,在MMMU Pro测试中达到76.8%,多项指标超越体积更大的上一代Gemini 2.5 Flash模型。
新模型在AI Studio和Vertex AI中标配了创新的“思考层级”功能,支持开发者灵活控制模型执行任务时的“思考深度”。在处理海量翻译或内容审核等基础任务时,可调低深度追求极致效率;在生成用户界面、构建数据看板或复杂逻辑模拟等高难度任务时,则可调高层级激发更深层推理能力。
Latitude、Cartwheel及Whering等早期测试企业已率先将3.1 Flash-Lite部署于复杂业务场景。测试团队反馈称,该模型不仅具备卓越的处理效率和逻辑推理能力,还能以媲美大型模型的精准度处理复杂输入指令。