OpenAI首席技术官透露Sora将于今年推出 加入音频生成功能
近日,据《华尔街日报》报道,OpenAI首席技术官米拉・穆拉蒂在接受采访时表示,公司计划在今年推出名为Sora的新产品,但可能需要等待几个月的时间。
穆拉蒂透露,除了向公众提供Sora外,OpenAI还计划为其加入音频生成功能,以增强场景的逼真感。此外,公司还计划允许用户编辑Sora生成的内容,因为AI工具并不总能产生准确的结果。她表示,公司正在努力寻找方法,使用户能够自行编辑和创作影音内容。
对于Sora的训练数据,穆拉蒂没有透露太多细节,仅表示这些数据都是公开的或获得许可的。她还提到,Sora使用的内容主要来自Shutterstock,但并没有确定是否还使用了YouTube、Facebook和Instagram等平台上的视频。
另外,穆拉蒂指出,Sora在发布后很可能无法生成包含公众人物的影音,并且生成的视频将带有AI水印。此前,Sora核心团队成员在WVFRM播客频道上表示,目前Sora仍处于反馈获取阶段,并不是一个完整的产品,暂时不会向公众开放。
在此背景下,另一个文生视频平台Pika于3月10日宣布推出新功能,允许用户在Pika生成的视频中无缝生成和整合声音。用户可以通过提示词描述想要的声音,也可以让Pika根据视频内容自动生成声音。
随着人工智能技术的不断发展,视频生成和编辑工具的功能越来越强大,用户将能够更轻松地创建出高质量的影音内容。