OpenAI发布ChatGPT Images 2.0:AI生图引入“思考能力”,单次可生成8张连贯图像
4月22日,OpenAI发布博文,宣布推出AI生图工具ChatGPT Images 2.0。该工具基于GPT Image 2模型打造,核心升级在于引入了“思考能力”——AI在生成图像前会先进行推理规划,并可联网检索信息、依据上传文件创建视觉解析内容。这项功能目前已向ChatGPT Plus、Pro、Business及Enterprise订阅用户开放。
与传统的“输入提示词→生成图像”模式不同,ChatGPT Images 2.0在生成前会对图像结构进行推理规划。用户可以启用“思考能力”,让AI联网检索信息,或依据上传的文件创建视觉解析内容。这意味着AI不再只是“看图说话”,而是“想清楚再画”。
在多图生成能力上,Images 2.0实现重大突破,支持单次提示生成最多8张图像。关键在于,系统可在不同场景中保持角色、物体及风格的一致性。OpenAI表示,这将大幅降低漫画页面、社交媒体系列配图及室内设计方案的创作门槛。对于需要制作系列内容的创作者而言,这无疑是一个效率利器。
图像质量上,新版本支持最高2K分辨率,宽高比范围扩展至3:1与1:3,并优化了像素艺术、漫画及电影剧照等风格。在多语言支持方面,该工具重点改进了中文、日语、韩语、印地语及孟加拉语的文本生成能力。
从“画得快”到“想得深”,ChatGPT Images 2.0正在将AI生图推向新的高度。对于设计师、内容创作者和营销人员而言,这意味着更高效、更可控、更连贯的视觉创作体验。