谷歌 Gemini 2.5 Flash 混合推理 AI 模型上线 性能成本双优

2025-04-18 18:39:00   |   微观猎人   |   1284

4月18日,谷歌公司发布公告,宣布在 Google AI Studio 和 Vertex AI 中,以 Gemini API 的方式推出 Gemini 2.5 Flash Preview 预览 AI 模型。用户还可通过 Gemini 应用内的模型选择器直接使用,并结合 Canvas 工具优化文档和代码编辑。

据此前报道,Gemini 2.5 Flash 是一个混合推理模型,具备“动态且可控”的计算能力,开发者能够根据查询请求的复杂程度灵活调整处理时间。谷歌指出,Gemini 2.5 Flash 非常适合用于“高容量”和“实时”的应用场景,例如客户服务和文档解析。谷歌在其博客文章中提到:“这款工作型模型专门针对低延迟和降低成本进行了优化,是响应式虚拟助手和实时总结工具的理想引擎”。

根据谷歌官方公布的定价,Gemini 2.5 Flash 模型每 100 万 tokens 输入为 0.15 美元,每 100 万 tokens 输出(不含推理)为 0.6 美元、每 100 万 tokens 输出(含推理)为 3.5 美元.作为首款全混合推理模型,开发者可根据需求开关推理功能,灵活调整响应质量、成本和延迟,与 Anthropic 和 Grok 的前沿模型相比,Gemini 2.5 Flash 成本更低但表现不俗。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺,请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时发送相关信息至bireading@163.com,本站将会在48小时内处理完毕。

谷歌 Gemini 2.5 Flash 混合推理 AI 模型上线 性能成本双优

2025-04-18 18:39:00 浏览量: 1284 作者: 微观猎人

4月18日,谷歌公司发布公告,宣布在 Google AI Studio 和 Vertex AI 中,以 Gemini API 的方式推出 Gemini 2.5 Flash Preview 预览 AI 模型。用户还可通过 Gemini 应用内的模型选择器直接使用,并结合 Canvas 工具优化文档和代码编辑。

据此前报道,Gemini 2.5 Flash 是一个混合推理模型,具备“动态且可控”的计算能力,开发者能够根据查询请求的复杂程度灵活调整处理时间。谷歌指出,Gemini 2.5 Flash 非常适合用于“高容量”和“实时”的应用场景,例如客户服务和文档解析。谷歌在其博客文章中提到:“这款工作型模型专门针对低延迟和降低成本进行了优化,是响应式虚拟助手和实时总结工具的理想引擎”。

根据谷歌官方公布的定价,Gemini 2.5 Flash 模型每 100 万 tokens 输入为 0.15 美元,每 100 万 tokens 输出(不含推理)为 0.6 美元、每 100 万 tokens 输出(含推理)为 3.5 美元.作为首款全混合推理模型,开发者可根据需求开关推理功能,灵活调整响应质量、成本和延迟,与 Anthropic 和 Grok 的前沿模型相比,Gemini 2.5 Flash 成本更低但表现不俗。

,

Copyright ©2018 铋读网 All Rights Reserved.

京ICP备18051707号

京公网安备 11011302001633号