阿里通义大模型Wan2.2-I2V-Flash 上线 图生视频提速12倍
8月11日,阿里云正式发布通义万相(Wan)大模型的最新版本Wan2.2-I2V-Flash,该模型在图生视频(Image-to-Video)任务中实现重大突破,推理速度较前代Wan2.1提升12倍,同时成本大幅优化,定价仅为0.1元/秒。此外,其“抽卡”成功率(即高质量视频生成率)提升123%,为影视、广告等视觉创作领域提供高效工具。
据官方介绍,Wan2.2-I2V-Flash的核心优势体现在三方面:
1. 极速生成:通过架构优化,模型响应效率显著提高,适合实时或批量视频生成需求。
2. 精准控制:支持复杂运镜指令(如推拉、摇移)和特效提示词(如粒子、光影),生成画面更符合专业级影视要求。
3. 风格一致性:对输入图像的风格(如插画、写实、CG)保持高度还原,动态效果自然合理。
此次更新是阿里通义万相系列模型的又一次迭代。早在7月28日,阿里已开源Wan2.2的三个子模型,包括文生视频(T2V)、图生视频(I2V)和统一视频生成(IT2V),其中前两者采用MoE(混合专家)架构,总参数量27B,激活参数14B,在保证生成质量的同时降低计算消耗。开源模型还首创“电影美学控制系统”,可精细调节光影、色彩等元素,接近专业电影制作水平。
目前,Wan2.2-I2V-Flash已通过阿里云百炼平台开放API调用,开发者可快速集成至工作流。业内分析认为,该模型将加速短视频、游戏、电商等内容生产领域的效率革新,而其高性价比也有望推动AI视频生成技术的大规模商用。