谷歌发布 Veo 2 预览版与 Imagen 3 更新视频与图像生成能力再升级

2024-12-17 10:30:02 | 文白不白 | 2511

近日，谷歌在生成式人工智能领域再度发力，周一正式宣布推出 Veo 2 预览版，并对其文本生成图像模型 Imagen 3 进行了重要升级。

Veo 2 是谷歌最新的视频生成模型，标志着其在 AI 视频技术上的重大进步。据谷歌介绍，Veo 2 能够理解电影摄影语言，这意味着用户可以在提示中引用特定类型的电影风格、镜头效果或电影叙事语言，从而生成更具专业感的视频内容。

此外，Veo 2 对现实世界的物理规则和人体运动也有了更深入的理解，显著改善了生成运动中人体的建模效果——这是许多生成式模型难以克服的技术难题。谷歌表示，Veo 2 在解决“多余手指”等常见伪影问题上表现更为出色，生成内容的质量和真实性均有所提升。

目前，Veo 2 正逐步向美国的 Google Labs 用户开放测试，测试阶段的生成能力为 720p 分辨率、最多 8 秒的视频素材。相比之下，OpenAI 的 Sora 可以生成最长 20 秒、1080p 分辨率的视频，但需要每月 200 美元的 ChatGPT Pro 订阅服务。

与此同时，谷歌对其文本生成图像模型 Imagen 3 进行了显著优化。新版 Imagen 3 在以下几个方面表现更优：图像质量提升：生成的图像更加明亮，构图更为精致。艺术风格丰富：能够更准确地渲染多样化的艺术风格，满足不同创作需求。提示忠实度提高：更精准地遵循用户提示，减少理解偏差，生成结果更贴合需求。

这些增强功能现已通过 ImageFX 提供给全球 100 多个国家的 Google Labs 用户，为创作者提供了更强大的文本到图像生成工具。

特别提醒：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺，请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益，请及时发送相关信息至bireading@163.com，本站将会在48小时内处理完毕。

谷歌发布 Veo 2 预览版与 Imagen 3 更新 视频与图像生成能力再升级

谷歌发布 Veo 2 预览版与 Imagen 3 更新视频与图像生成能力再升级