字节跳动 AI 助手豆包被曝开启视频生成内测 进军视频创作领域
11月7日,根据《科创板日报》的报道字节跳动大模型AI助手“豆包”正式推出视频生成内测,标志着公司正式进军AI视频创作领域。此次推出的视频生成模型可支持图片文字一键生成成片、动态运镜、多镜头一致性,并允许用户自由选择风格与比例,适用于电商营销、动画教育、城市文旅等多种行业应用。
据报道,火山引擎总裁谭待表示,豆包视频生成大模型在多风格、多比例、一致性和多镜头生成方面达到了业界先进水平。与市面上现有的视频生成工具不同,豆包的视频生成模型能够处理更复杂的任务,例如多主体交互、动态动作和多镜头切换。这使得创作者可以生成更加自然连贯的影片,并且人物样貌、服装细节和头饰在不同镜头下都能保持一致,接近实拍效果。
豆包视频生成模型采用了先进的DiT架构,通过高效的计算单元,使得视频能够在大动态与运镜中自由切换。用户可以利用变焦、环绕、平摇、缩放、目标跟随等多种镜头语言,实现更加丰富的视频效果。此外,豆包还具备专业级的光影布局和色彩调和,使得生成的视频在视觉效果上更加美观和真实。
在风格选择方面,豆包的视频生成模型支持多种艺术风格,包括3D动画、2D动画、国画、黑白画、厚涂等,且能够适配电影、电视、电脑、手机等多种设备的显示比例。无论是企业场景中的电商营销、教育培训,还是专业创作者的艺术创作,豆包都能提供强有力的创作支持。
据火山引擎介绍,豆包视频生成模型目前已经在Pixeldance和Seaweed两个版本上开展了邀测,企业用户可以通过火山引擎官网提交测试申请。字节跳动此次进入视频生成领域,无疑为创作者提供了更多的创作自由,同时也为相关行业提供了更为便捷和高效的内容生产工具。