谷歌推出Gemini 2.5 Flash 主打低成本、高效率AI模型

2025-04-10 09:28:22 | 棠糖 | 1706

4月10日，据报道，谷歌正式发布全新AI模型 Gemini 2.5 Flash，主打“高效能、低成本”，专为大批量、实时性应用场景优化，如客服对话、文档解析等。该模型即将登陆谷歌AI开发平台 Vertex AI，开发者可根据需求灵活调整速度、准确性和成本，以应对不同业务场景。

在AI大模型成本不断攀升的背景下，Gemini 2.5 Flash 提供了更具性价比的选择。谷歌表示，该模型针对“高容量、实时响应”场景优化，特别适合构建智能客服、实时摘要工具等应用，能够在大规模部署时显著降低成本。

与OpenAI的 GPT-3.5-turbo、DeepSeek的 R1 等推理优化模型类似，Gemini 2.5 Flash 在回答问题时可能稍慢于旗舰模型，但更注重平衡速度与成本。谷歌在官方博客中强调：“开发者可以动态调整计算资源，根据查询复杂度优化性能。”

除云端服务外，谷歌还宣布，从2024年第三季度开始，Gemini系列模型（包括2.5 Flash）将支持本地化部署，通过谷歌分布式云（GDC）提供给对数据隐私要求严格的企业客户。谷歌表示，正与英伟达合作，将Gemini适配至 Blackwell架构GPU，客户可通过谷歌或其合作伙伴采购相关硬件。

目前，谷歌尚未发布Gemini 2.5 Flash的安全性和技术报告，因此其具体能力边界尚不明确。此前，谷歌曾表示，对于“实验性”模型不会提供详细报告，这可能影响部分企业对模型可靠性的评估。

特别提醒：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺，请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益，请及时发送相关信息至bireading@163.com，本站将会在48小时内处理完毕。