谷歌发布Gemini 3.1 Flash-Lite：速度最快、成本最低的轻量级AI模型

2026-03-04 09:59:38 | 弘乐 | 1324

3月4日，谷歌发布轻量级AI模型Gemini 3.1 Flash-Lite，声称是其速度最快、最具成本效益的Gemini 3系列模型。开发者即日起可通过Google AI Studio中的Gemini API获取预览版，企业级用户可在Vertex AI平台同步体验。

谷歌为该模型制定了极具竞争力的价格：每百万输入Tokens收费0.25美元，每百万输出Tokens为1.50美元。这一定价策略旨在大幅降低AI应用的开发与部署门槛。

在低售价的同时，Gemini 3.1 Flash-Lite实现性能大幅跨越。权威评测平台Artificial Analysis数据显示，与前代2.5 Flash相比，新模型的首字响应速度提升2.5倍，整体输出速度同步提升45%，极低延迟特性使其成为构建实时响应体验的理想选择。

在各项核心能力测试中，3.1 Flash-Lite展现出越级实力。该模型在Arena.ai排行榜斩获1432分Elo得分，在GPQA Diamond测试中得分率高达86.9%，在MMMU Pro测试中达到76.8%，多项指标超越体积更大的上一代Gemini 2.5 Flash模型。

新模型在AI Studio和Vertex AI中标配了创新的“思考层级”功能，支持开发者灵活控制模型执行任务时的“思考深度”。在处理海量翻译或内容审核等基础任务时，可调低深度追求极致效率；在生成用户界面、构建数据看板或复杂逻辑模拟等高难度任务时，则可调高层级激发更深层推理能力。

Latitude、Cartwheel及Whering等早期测试企业已率先将3.1 Flash-Lite部署于复杂业务场景。测试团队反馈称，该模型不仅具备卓越的处理效率和逻辑推理能力，还能以媲美大型模型的精准度处理复杂输入指令。

特别提醒：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺，请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益，请及时发送相关信息至bireading@163.com，本站将会在48小时内处理完毕。