谷歌推出Gemini 2.5 Flash 主打低成本、高效率AI模型

2025-04-10 09:28:22   |   棠糖   |   1686

4月10日,据报道,谷歌正式发布全新AI模型 Gemini 2.5 Flash,主打“高效能、低成本”,专为大批量、实时性应用场景优化,如客服对话、文档解析等。该模型即将登陆谷歌AI开发平台 Vertex AI,开发者可根据需求灵活调整速度、准确性和成本,以应对不同业务场景。  

在AI大模型成本不断攀升的背景下,Gemini 2.5 Flash 提供了更具性价比的选择。谷歌表示,该模型针对“高容量、实时响应”场景优化,特别适合构建 智能客服、实时摘要工具 等应用,能够在大规模部署时显著降低成本。  

与OpenAI的 GPT-3.5-turbo、DeepSeek的 R1 等推理优化模型类似,Gemini 2.5 Flash 在回答问题时可能稍慢于旗舰模型,但更注重 平衡速度与成本。谷歌在官方博客中强调:“开发者可以动态调整计算资源,根据查询复杂度优化性能。”  

除云端服务外,谷歌还宣布,从2024年第三季度开始,Gemini系列模型(包括2.5 Flash)将支持 本地化部署,通过 谷歌分布式云(GDC) 提供给对数据隐私要求严格的企业客户。谷歌表示,正与 英伟达 合作,将Gemini适配至 Blackwell架构GPU,客户可通过谷歌或其合作伙伴采购相关硬件。  

目前,谷歌尚未发布Gemini 2.5 Flash的 安全性和技术报告,因此其具体能力边界尚不明确。此前,谷歌曾表示,对于“实验性”模型不会提供详细报告,这可能影响部分企业对模型可靠性的评估。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺,请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时发送相关信息至bireading@163.com,本站将会在48小时内处理完毕。

谷歌推出Gemini 2.5 Flash 主打低成本、高效率AI模型

2025-04-10 09:28:22 浏览量: 1686 作者: 棠糖

4月10日,据报道,谷歌正式发布全新AI模型 Gemini 2.5 Flash,主打“高效能、低成本”,专为大批量、实时性应用场景优化,如客服对话、文档解析等。该模型即将登陆谷歌AI开发平台 Vertex AI,开发者可根据需求灵活调整速度、准确性和成本,以应对不同业务场景。  

在AI大模型成本不断攀升的背景下,Gemini 2.5 Flash 提供了更具性价比的选择。谷歌表示,该模型针对“高容量、实时响应”场景优化,特别适合构建 智能客服、实时摘要工具 等应用,能够在大规模部署时显著降低成本。  

与OpenAI的 GPT-3.5-turbo、DeepSeek的 R1 等推理优化模型类似,Gemini 2.5 Flash 在回答问题时可能稍慢于旗舰模型,但更注重 平衡速度与成本。谷歌在官方博客中强调:“开发者可以动态调整计算资源,根据查询复杂度优化性能。”  

除云端服务外,谷歌还宣布,从2024年第三季度开始,Gemini系列模型(包括2.5 Flash)将支持 本地化部署,通过 谷歌分布式云(GDC) 提供给对数据隐私要求严格的企业客户。谷歌表示,正与 英伟达 合作,将Gemini适配至 Blackwell架构GPU,客户可通过谷歌或其合作伙伴采购相关硬件。  

目前,谷歌尚未发布Gemini 2.5 Flash的 安全性和技术报告,因此其具体能力边界尚不明确。此前,谷歌曾表示,对于“实验性”模型不会提供详细报告,这可能影响部分企业对模型可靠性的评估。

,

Copyright ©2018 铋读网 All Rights Reserved.

京ICP备18051707号

京公网安备 11011302001633号