谷歌推出Gemini 2.5 Flash 主打低成本、高效率AI模型
4月10日,据报道,谷歌正式发布全新AI模型 Gemini 2.5 Flash,主打“高效能、低成本”,专为大批量、实时性应用场景优化,如客服对话、文档解析等。该模型即将登陆谷歌AI开发平台 Vertex AI,开发者可根据需求灵活调整速度、准确性和成本,以应对不同业务场景。
在AI大模型成本不断攀升的背景下,Gemini 2.5 Flash 提供了更具性价比的选择。谷歌表示,该模型针对“高容量、实时响应”场景优化,特别适合构建 智能客服、实时摘要工具 等应用,能够在大规模部署时显著降低成本。
与OpenAI的 GPT-3.5-turbo、DeepSeek的 R1 等推理优化模型类似,Gemini 2.5 Flash 在回答问题时可能稍慢于旗舰模型,但更注重 平衡速度与成本。谷歌在官方博客中强调:“开发者可以动态调整计算资源,根据查询复杂度优化性能。”
除云端服务外,谷歌还宣布,从2024年第三季度开始,Gemini系列模型(包括2.5 Flash)将支持 本地化部署,通过 谷歌分布式云(GDC) 提供给对数据隐私要求严格的企业客户。谷歌表示,正与 英伟达 合作,将Gemini适配至 Blackwell架构GPU,客户可通过谷歌或其合作伙伴采购相关硬件。
目前,谷歌尚未发布Gemini 2.5 Flash的 安全性和技术报告,因此其具体能力边界尚不明确。此前,谷歌曾表示,对于“实验性”模型不会提供详细报告,这可能影响部分企业对模型可靠性的评估。