谷歌Gemini上线Veo 3 AI视频生成功能 照片秒变8秒带音频短视频
7月11日,谷歌宣布其AI助手Gemini正式接入Veo 3模型,推出全新“图像转视频”功能。用户只需上传一张照片,即可生成一段8秒钟的短视频,并可添加背景音乐、环境音效甚至语音对白,让静态图片“活”起来。目前,该功能已面向部分地区的AI Ultra和AI Pro订阅用户开放,网页版率先上线,移动端将于本周逐步推送。
根据谷歌介绍,用户只需在Gemini的提示栏中选择“视频”工具,上传照片并输入提示词(如“海浪拍打岸边”“小狗摇尾巴”),AI便会根据描述生成动态效果。此外,用户还能进一步添加音频指令,例如对白(“嗨,今天天气真好!”)或音效(鸟鸣、风声),系统将确保画面与声音精准同步。最终生成的视频为720p分辨率、16:9横屏MP4格式,适合社交媒体分享。
谷歌举例称,这项技术可让日常物品动起来(如漂浮的茶杯)、赋予绘画作品生命力,或为风景照添加动态元素(如飘动的云层)。不过,所有生成视频均会附带明显的AI水印,并嵌入谷歌的SynthID隐形数字水印,以标识内容来源。
据报道,Veo是谷歌旗下DeepMind团队开发的视频生成模型,此次升级至Veo 3后,画面流畅度和音频同步能力显著提升。尽管目前视频长度限制为8秒,但其生成速度和易用性已优于多数同类产品。谷歌强调,该功能旨在帮助用户快速创作创意内容,而非替代专业视频制作。
目前,图像转视频功能仅向付费订阅用户开放(AI Ultra/Pro),免费版Gemini暂不支持。谷歌未透露后续是否会扩大开放范围,但表示将根据反馈优化生成效果。