谷歌发布Gemini Omni全能模型:支持任意输入生成任意输出
5月20日,在2026谷歌I/O开发者大会上,谷歌正式发布了Gemini Omni模型。诺贝尔奖获得者、Google DeepMind负责人哈萨比斯表示,Gemini Omni是Gemini模型家族迄今为止能力最为全面的版本。“Omni”意为“全能”,该模型在处理文字、图像、视频、音频等多种模态信息时,展现出前所未有的流畅性与深度。
Gemini Omni宣称能够“从任何输入生成任何输出”,支持对话式编辑,用户可用一句话改变视频中的角色、背景等元素。大会还宣布推出Gemini Omni家族首款模型Gemini Omni Flash,即日起可在Gemini App、Google Flow、YouTube Shorts中使用,未来将推出API服务。