火山引擎发布豆包音频生成模型1.0:全要素直出影视级成片

2026-06-24 17:19:07   |   探索者   |   3423

6月24日,火山引擎在昨日举行的FORCE原动力大会上正式发布了豆包音频生成模型1.0,标志着音频AI创作从"单句工具"跃迁为"音频导演"。该模型首次支持多模态参考生成——文本或音频任一模态作为输入,均可端到端生成高质量目标音频,并在长时生成场景中保持多角色音色一致,大幅减少后期修音工作。

影视级音频创作是全要素生成的核心突破。过去,一段成片级音频意味着对白、音效、配乐逐条生成、手动对齐、多轨混音,流程繁琐且高度依赖后期能力。豆包音频生成模型1.0将这一切压缩进一条Prompt,直接产出具备完整叙事感的成品音频。单条指令可同时定义多个角色的台词、语气和情绪节奏并保持声音一致;笑声、叹息、方言口音等细节精准还原;背景音乐、环境音效与人声统一生成,无需额外混编。实测中,模型一次生成了包含旁白、长老、少年三人对话及古筝、大鼓、剑鸣等多重音效的漫剧片段,直接达到交付水准。

长时一致性是另一大核心能力。长音频创作最棘手的痛点并非单句质量,而是角色在音频第1分钟和第10分钟听起来是否像同一个人。豆包音频生成模型1.0实现了文生音频与参考音频的深度联动,在长篇有声书、播客、长剧集等场景中保持音色高度统一。一次支持2分钟音频创作,以此参考输入延长时可在多次延长中保持音色一致。实测中,创作者用前版本16秒音频作为参考,Seed-Audio 1.0续接了包含完整对话和电话忙音的1分10秒剧情,音色状态完全一致。

零样本多模态参考则大幅降低了音频创作门槛。用户仅需文本描述即可生成匹配的声音特征,无需提供任何语音样本。模型还实现了音色与风格的解耦控制,支持"一声多角"——同一个声音在不同角色设定下呈现差异化表达。

目前,豆包音频生成模型1.0已在火山方舟开启API邀测,个人用户可在体验中心免费享有30分钟创作额度,后续将上线剪映、即梦、番茄等产品。业内人士指出,该模型补齐了豆包全链路创作的音频板块,标志着图文、视频、音频已全面实现AI一体化创作,一人即是一支完整的音频制作团队。

特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺,请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时发送相关信息至bireading@163.com,本站将会在48小时内处理完毕。

火山引擎发布豆包音频生成模型1.0:全要素直出影视级成片

2026-06-24 17:19:07 浏览量: 3423 作者: 探索者

6月24日,火山引擎在昨日举行的FORCE原动力大会上正式发布了豆包音频生成模型1.0,标志着音频AI创作从"单句工具"跃迁为"音频导演"。该模型首次支持多模态参考生成——文本或音频任一模态作为输入,均可端到端生成高质量目标音频,并在长时生成场景中保持多角色音色一致,大幅减少后期修音工作。

影视级音频创作是全要素生成的核心突破。过去,一段成片级音频意味着对白、音效、配乐逐条生成、手动对齐、多轨混音,流程繁琐且高度依赖后期能力。豆包音频生成模型1.0将这一切压缩进一条Prompt,直接产出具备完整叙事感的成品音频。单条指令可同时定义多个角色的台词、语气和情绪节奏并保持声音一致;笑声、叹息、方言口音等细节精准还原;背景音乐、环境音效与人声统一生成,无需额外混编。实测中,模型一次生成了包含旁白、长老、少年三人对话及古筝、大鼓、剑鸣等多重音效的漫剧片段,直接达到交付水准。

长时一致性是另一大核心能力。长音频创作最棘手的痛点并非单句质量,而是角色在音频第1分钟和第10分钟听起来是否像同一个人。豆包音频生成模型1.0实现了文生音频与参考音频的深度联动,在长篇有声书、播客、长剧集等场景中保持音色高度统一。一次支持2分钟音频创作,以此参考输入延长时可在多次延长中保持音色一致。实测中,创作者用前版本16秒音频作为参考,Seed-Audio 1.0续接了包含完整对话和电话忙音的1分10秒剧情,音色状态完全一致。

零样本多模态参考则大幅降低了音频创作门槛。用户仅需文本描述即可生成匹配的声音特征,无需提供任何语音样本。模型还实现了音色与风格的解耦控制,支持"一声多角"——同一个声音在不同角色设定下呈现差异化表达。

目前,豆包音频生成模型1.0已在火山方舟开启API邀测,个人用户可在体验中心免费享有30分钟创作额度,后续将上线剪映、即梦、番茄等产品。业内人士指出,该模型补齐了豆包全链路创作的音频板块,标志着图文、视频、音频已全面实现AI一体化创作,一人即是一支完整的音频制作团队。

,

Copyright ©2018 铋读网 All Rights Reserved.

京ICP备18051707号

京公网安备 11011302001633号