阿里云通义千问发布Qwen-Image-Edit 图像编辑AI迈入精准可控新时代
8月19日,阿里云旗下通义千问团队正式推出Qwen-Image-Edit图像编辑模型,标志着AI图像处理技术从生成向精准编辑的重要跨越。这款基于20B参数Qwen-Image模型进一步训练的创新产品,成功实现了对图像内容从语义到像素级别的双重控制。
Qwen-Image-Edit的创新之处在于其独特的双通道处理架构。通过同时接入Qwen2.5-VL模型和VAE编码器,该技术既能理解图像的深层语义,又能精确控制视觉外观表现。这种双重能力使其不仅可以完成IP形象创作、物体旋转等需要保持语义一致的高阶编辑,还能实现文字修改、元素增减等要求局部精确控制的低阶操作。特别是在文字编辑方面,模型能够精准保持原有字体风格,支持中英文双语的无缝修改。
从官方展示的案例来看,该技术已具备丰富的实用价值。在创意设计领域,可以快速生成MBTI十六型人格表情包等IP衍生内容;在商业摄影后期,能轻松完成人物背景替换、服装调整等复杂操作;对于平面设计行业,则提供了直接修改海报文字的便捷工具。更令人印象深刻的是其"链式编辑"能力,通过分步骤渐进修正,最终实现了《兰亭集序》书法作品的精准修复,展现出处理复杂文化内容的潜力。