OpenAI GPT-Image-2 节点

OpenAI GPT-Image-2 (gpt-image-2) 是 OpenAI 最新的图像模型,现已通过合作伙伴节点 (Partner Nodes) 在 ComfyUI 中可用。它是 OpenAI 第一个在生成前会进行推理的图像模型:模型不会一次性采样,而是先规划画面构图,检查结果,并进行迭代。该节点支持:

文生图,能够稳定处理密集文字、小尺寸 UI 元素、图标、信息图、地图、幻灯片以及漫画分镜
图像编辑,在最高 2K 分辨率下保持结构一致性
单次提示词最多生成 8 张保持角色和物体连续性的图像

节点概述

GPT-Image-2 在节点库中通过 OpenAI GPT Image 1.5 节点的 model 选项进行选择。该节点会同步调用 OpenAI 的图像生成 API,并返回与描述匹配的图像。

使用 API 节点需要保证你已经正常登录，并在受许可的网络环境下使用，请参考API 节点总览部分文档来了解使用 API 节点的具体使用要求。

便携版或手动安装用户
桌面版或云端用户

请确保你的 ComfyUI 已经更新。

本指南里的工作流可以在 ComfyUI 的工作流模板中找到。如果找不到，可能是 ComfyUI 没有更新。如果加载工作流时有节点缺失，可能原因有：

你用的不是最新开发版（nightly）。
你用的是稳定版或桌面版（没有包含最新的更新）。
启动时有些节点导入失败。

快速开始

将 ComfyUI 更新到最新版本(v0.19.4 或更高),或使用 Comfy Cloud。
在节点库中搜索 OpenAI GPT Image 1.5 并添加节点。
将 model 字段设置为 gpt-image-2。

可用工作流

文生图 (T2I)

通过文本提示词生成图像,利用 GPT-Image-2 基于推理的构图能力。

在 Comfy Cloud 运行文生图

在 Comfy Cloud 上一键体验文生图工作流。

下载文生图工作流

下载工作流 JSON 文件。

图像编辑

对输入图像进行编辑,在最高 2K 分辨率下保持结构一致性。

在 Comfy Cloud 运行图像编辑

在 Comfy Cloud 上一键体验图像编辑工作流。

下载图像编辑工作流

下载工作流 JSON 文件。

主要能力

基于推理的生成

GPT-Image-2 会在渲染前先规划画面构图,因此非常适合那些以往容易让图像模型翻车的提示词 —— 比如”一张海报,包含 11pt Helvetica 字体居中排版的 7 项要点列表”—— 在密集文字、小尺寸 UI 元素、图标、信息图、地图和幻灯片等场景下都能输出干净可用的结果。

不损坏其他细节的图像编辑

GPT-Image-2 在执行局部编辑时保持结构一致性,在编辑区域之外的像素保持稳定,同时在最高 2K 分辨率下完成所请求的修改。可用于黑白照片上色、把白天场景改为黄昏等任务,而不会让面部、几何结构或细节遭到破坏。

单次提示最多 8 张一致性图像

模型可在单次提示中返回最多 8 张不同的图像,并在整组图像中保持角色和物体的连续性。这非常适合分镜、角色三视图、产品变体等场景,无需再依赖固定随机种子或复杂的提示词技巧。可以直接把这一批图像送入 Save Image 节点,或继续接入下游的视频工作流。 GPT-Image-2 一致性图像示例

混合工作流

GPT-Image-2 可以自然嵌入到混合工作流中:用它生成包含大量文字的关键画面,然后交给本地模型进行放大、风格化或视频生成 —— 在同一个工作流中,每个步骤都用最合适的模型。

开始使用

Agent Tools / MCP

基础概念

界面指南

教程

合作伙伴节点

OpenAI GPT-Image-2 节点

节点概述

快速开始