谷歌发布 Veo 2 预览版与 Imagen 3 更新 视频与图像生成能力再升级

2024-12-17 10:30:02   |   文白不白   |   2505

近日,谷歌在生成式人工智能领域再度发力,周一正式宣布推出 Veo 2 预览版,并对其文本生成图像模型 Imagen 3 进行了重要升级。

Veo 2 是谷歌最新的视频生成模型,标志着其在 AI 视频技术上的重大进步。据谷歌介绍,Veo 2 能够 理解电影摄影语言,这意味着用户可以在提示中引用特定类型的电影风格、镜头效果或电影叙事语言,从而生成更具专业感的视频内容。

此外,Veo 2 对 现实世界的物理规则和人体运动 也有了更深入的理解,显著改善了生成运动中人体的建模效果——这是许多生成式模型难以克服的技术难题。谷歌表示,Veo 2 在解决“多余手指”等常见伪影问题上表现更为出色,生成内容的质量和真实性均有所提升。

目前,Veo 2 正逐步向美国的 Google Labs 用户 开放测试,测试阶段的生成能力为 720p 分辨率、最多 8 秒的视频素材。相比之下,OpenAI 的 Sora 可以生成最长 20 秒、1080p 分辨率的视频,但需要每月 200 美元的 ChatGPT Pro 订阅服务。

与此同时,谷歌对其文本生成图像模型 Imagen 3 进行了显著优化。新版 Imagen 3 在以下几个方面表现更优:图像质量提升:生成的图像更加明亮,构图更为精致。艺术风格丰富:能够更准确地渲染多样化的艺术风格,满足不同创作需求。提示忠实度提高:更精准地遵循用户提示,减少理解偏差,生成结果更贴合需求。

这些增强功能现已通过 ImageFX 提供给全球 100 多个国家 的 Google Labs 用户,为创作者提供了更强大的文本到图像生成工具。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺,请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时发送相关信息至bireading@163.com,本站将会在48小时内处理完毕。

谷歌发布 Veo 2 预览版与 Imagen 3 更新 视频与图像生成能力再升级

2024-12-17 10:30:02 浏览量: 2505 作者: 文白不白

近日,谷歌在生成式人工智能领域再度发力,周一正式宣布推出 Veo 2 预览版,并对其文本生成图像模型 Imagen 3 进行了重要升级。

Veo 2 是谷歌最新的视频生成模型,标志着其在 AI 视频技术上的重大进步。据谷歌介绍,Veo 2 能够 理解电影摄影语言,这意味着用户可以在提示中引用特定类型的电影风格、镜头效果或电影叙事语言,从而生成更具专业感的视频内容。

此外,Veo 2 对 现实世界的物理规则和人体运动 也有了更深入的理解,显著改善了生成运动中人体的建模效果——这是许多生成式模型难以克服的技术难题。谷歌表示,Veo 2 在解决“多余手指”等常见伪影问题上表现更为出色,生成内容的质量和真实性均有所提升。

目前,Veo 2 正逐步向美国的 Google Labs 用户 开放测试,测试阶段的生成能力为 720p 分辨率、最多 8 秒的视频素材。相比之下,OpenAI 的 Sora 可以生成最长 20 秒、1080p 分辨率的视频,但需要每月 200 美元的 ChatGPT Pro 订阅服务。

与此同时,谷歌对其文本生成图像模型 Imagen 3 进行了显著优化。新版 Imagen 3 在以下几个方面表现更优:图像质量提升:生成的图像更加明亮,构图更为精致。艺术风格丰富:能够更准确地渲染多样化的艺术风格,满足不同创作需求。提示忠实度提高:更精准地遵循用户提示,减少理解偏差,生成结果更贴合需求。

这些增强功能现已通过 ImageFX 提供给全球 100 多个国家 的 Google Labs 用户,为创作者提供了更强大的文本到图像生成工具。

,

Copyright ©2018 铋读网 All Rights Reserved.

京ICP备18051707号

京公网安备 11011302001633号