B站开源动漫视频生成模型AniSora V3发布

2025-07-07 10:43:44 | 微观猎人 | 1826

7月7日，哔哩哔哩正式推出开源动漫视频生成模型AniSora V3预览版，这是继去年V2版本后的又一次重大升级。

据报道，在技术层面，AniSora V3基于B站此前开源的CogVideoX-5B和Wan2.1-14B模型，通过引入强化学习与人类反馈（RLHF）优化框架，大幅提升了生成视频的视觉质量和动作连贯性。最引人注目的是其全新升级的时空掩码模块，能够实现更精细的角色表情控制和动态镜头移动，甚至可以完成"五位女孩同步舞蹈，镜头随动作推近拉远"这样复杂的动画指令。

值得一提的是，V3版本特别针对国产硬件进行了优化，新增对华为Ascend910B NPU的原生支持，使得推理速度提升约20%。在实际测试中，生成一段4秒的1080p高清视频仅需2-3分钟，大大提升了创作效率。同时，经过优化的数据清洗流程确保了生成内容在风格上的一致性，让创作者能够更精准地控制作品的艺术风格。

从应用场景来看，AniSora V3展现出强大的多任务处理能力。无论是将单张静态图片转化为动态视频，还是为漫画分镜添加口型同步的动画效果，亦或是辅助VTuber进行实时动作生成，V3版本都能提供专业级的支持。测试数据显示，相比前代版本，V3在生成复杂场景时的伪影问题减少了15%，在角色一致性和动作流畅度等关键指标上都达到了业界领先水平。

与OpenAI的Sora等通用视频生成模型不同，AniSora V3专注于动漫这一垂直领域，在二次元风格的表现上更具优势。目前，已有开发者基于V3开发出能够强化特定动漫风格的定制插件，如吉卜力风格或赛博朋克风格的专用生成器。这种专业化的发展路线，使得AniSora在动漫内容创作领域形成了独特的竞争优势。

特别提醒：本网信息来自于互联网，目的在于传递更多信息，并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字、图片等内容的真实性、完整性、及时性本站不作任何保证或承诺，请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益，请及时发送相关信息至bireading@163.com，本站将会在48小时内处理完毕。