字节跳动发布多模态图像创作模型Seedream 4.0
9月9日,字节跳动Seed团队正式推出新一代图像创作模型Seedream 4.0。该模型采用统一架构实现文生图与通用图像编辑能力,在生成效果、推理速度和功能多样性方面较前代实现显著突破,目前已正式接入豆包App、即梦AI及扣子等产品,面向用户免费开放,同时通过火山引擎向企业客户提供服务。
Seedream 4.0支持文本、图像的多模态组合输入,可完成文生图、图生图、图像编辑、多图协同编辑和组图生成等多种创作任务。该模型在艺术风格迁移方面表现出高度灵活性,用户可在巴洛克、赛博朋克等多种风格间自由切换甚至融合创新,生成具有突出美感的图像作品。
在技术层面,新模型展现出更强的常识推理与逻辑理解能力。它不仅能够处理物理约束、时间逻辑等复杂生成条件,还可完成解谜填字、漫画续写等需要多步推理的任务。通过架构优化与蒸馏加速技术,其图像生成速度较Seedream 3.0提升超过10倍,并支持最高4K超高清分辨率的输出。
Seed团队强调,Seedream 4.0不仅是一个图像生成工具,更是一个“具备知识思考和创意表达能力的多模态引擎”。该模型提出八类基础玩法,覆盖从日常创作到专业应用的多个场景,展现出技术在创意产业中的广泛适应性。