OpenAI GPT-Image-2 (Documentation Index
Fetch the complete documentation index at: https://docs.comfy.org/llms.txt
Use this file to discover all available pages before exploring further.
gpt-image-2) 是 OpenAI 最新的图像模型,现已通过合作伙伴节点 (Partner Nodes) 在 ComfyUI 中可用。它是 OpenAI 第一个在生成前会进行推理的图像模型:模型不会一次性采样,而是先规划画面构图,检查结果,并进行迭代。
该节点支持:
- 文生图,能够稳定处理密集文字、小尺寸 UI 元素、图标、信息图、地图、幻灯片以及漫画分镜
- 图像编辑,在最高 2K 分辨率下保持结构一致性
- 单次提示词最多生成 8 张保持角色和物体连续性的图像
节点概述
GPT-Image-2 在节点库中通过 OpenAI GPT Image 1.5 节点的model 选项进行选择。该节点会同步调用 OpenAI 的图像生成 API,并返回与描述匹配的图像。
快速开始
- 将 ComfyUI 更新到最新版本(v0.19.4 或更高),或使用 Comfy Cloud。
- 在节点库中搜索 OpenAI GPT Image 1.5 并添加节点。
- 将
model字段设置为gpt-image-2。
可用工作流
文生图 (T2I)
通过文本提示词生成图像,利用 GPT-Image-2 基于推理的构图能力。在 Comfy Cloud 运行文生图
在 Comfy Cloud 上一键体验文生图工作流。
下载文生图工作流
下载工作流 JSON 文件。
图像编辑
对输入图像进行编辑,在最高 2K 分辨率下保持结构一致性。在 Comfy Cloud 运行图像编辑
在 Comfy Cloud 上一键体验图像编辑工作流。
下载图像编辑工作流
下载工作流 JSON 文件。
主要能力
基于推理的生成
GPT-Image-2 会在渲染前先规划画面构图,因此非常适合那些以往容易让图像模型翻车的提示词 —— 比如”一张海报,包含 11pt Helvetica 字体居中排版的 7 项要点列表”—— 在密集文字、小尺寸 UI 元素、图标、信息图、地图和幻灯片等场景下都能输出干净可用的结果。不损坏其他细节的图像编辑
GPT-Image-2 在执行局部编辑时保持结构一致性,在编辑区域之外的像素保持稳定,同时在最高 2K 分辨率下完成所请求的修改。可用于黑白照片上色、把白天场景改为黄昏等任务,而不会让面部、几何结构或细节遭到破坏。单次提示最多 8 张一致性图像
模型可在单次提示中返回最多 8 张不同的图像,并在整组图像中保持角色和物体的连续性。这非常适合分镜、角色三视图、产品变体等场景,无需再依赖固定随机种子或复杂的提示词技巧。可以直接把这一批图像送入Save Image 节点,或继续接入下游的视频工作流。