谷歌发布Gemini Omni全能模型：支持任意输入生成任意输出

2026-05-20 17:31:29 | 唐薇 | 1815

5月20日，在2026谷歌I/O开发者大会上，谷歌正式发布了Gemini Omni模型。诺贝尔奖获得者、Google DeepMind负责人哈萨比斯表示，Gemini Omni是Gemini模型家族迄今为止能力最为全面的版本。“Omni”意为“全能”，该模型在处理文字、图像、视频、音频等多种模态信息时，展现出前所未有的流畅性与深度。

Gemini Omni宣称能够“从任何输入生成任何输出”，支持对话式编辑，用户可用一句话改变视频中的角色、背景等元素。大会还宣布推出Gemini Omni家族首款模型Gemini Omni Flash，即日起可在Gemini App、Google Flow、YouTube Shorts中使用，未来将推出API服务。

特别提醒：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺，请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益，请及时发送相关信息至bireading@163.com，本站将会在48小时内处理完毕。