跳转到主要内容

Documentation Index

Fetch the complete documentation index at: https://docs.comfy.org/llms.txt

Use this file to discover all available pages before exploring further.

OpenAI GPT-Image-2 (gpt-image-2) 是 OpenAI 最新的图像模型,现已通过合作伙伴节点 (Partner Nodes) 在 ComfyUI 中可用。它是 OpenAI 第一个在生成前会进行推理的图像模型:模型不会一次性采样,而是先规划画面构图,检查结果,并进行迭代。 该节点支持:
  • 文生图,能够稳定处理密集文字、小尺寸 UI 元素、图标、信息图、地图、幻灯片以及漫画分镜
  • 图像编辑,在最高 2K 分辨率下保持结构一致性
  • 单次提示词最多生成 8 张保持角色和物体连续性的图像

节点概述

GPT-Image-2 在节点库中通过 OpenAI GPT Image 1.5 节点的 model 选项进行选择。该节点会同步调用 OpenAI 的图像生成 API,并返回与描述匹配的图像。
使用 API 节点需要保证你已经正常登录,并在受许可的网络环境下使用,请参考API 节点总览部分文档来了解使用 API 节点的具体使用要求。
请确保你的 ComfyUI 已经更新。本指南里的工作流可以在 ComfyUI 的工作流模板中找到。如果找不到,可能是 ComfyUI 没有更新。如果加载工作流时有节点缺失,可能原因有:
  1. 你用的不是最新开发版(nightly)。
  2. 你用的是稳定版或桌面版(没有包含最新的更新)。
  3. 启动时有些节点导入失败。

快速开始

  1. 将 ComfyUI 更新到最新版本(v0.19.4 或更高),或使用 Comfy Cloud
  2. 在节点库中搜索 OpenAI GPT Image 1.5 并添加节点。
  3. model 字段设置为 gpt-image-2

可用工作流

文生图 (T2I)

通过文本提示词生成图像,利用 GPT-Image-2 基于推理的构图能力。

在 Comfy Cloud 运行文生图

在 Comfy Cloud 上一键体验文生图工作流。

下载文生图工作流

下载工作流 JSON 文件。
GPT-Image-2 文生图示例

图像编辑

对输入图像进行编辑,在最高 2K 分辨率下保持结构一致性。

在 Comfy Cloud 运行图像编辑

在 Comfy Cloud 上一键体验图像编辑工作流。

下载图像编辑工作流

下载工作流 JSON 文件。
GPT-Image-2 图生图示例 GPT-Image-2 图像编辑示例 1 GPT-Image-2 图像编辑示例 2

主要能力

基于推理的生成

GPT-Image-2 会在渲染前先规划画面构图,因此非常适合那些以往容易让图像模型翻车的提示词 —— 比如”一张海报,包含 11pt Helvetica 字体居中排版的 7 项要点列表”—— 在密集文字、小尺寸 UI 元素、图标、信息图、地图和幻灯片等场景下都能输出干净可用的结果。

不损坏其他细节的图像编辑

GPT-Image-2 在执行局部编辑时保持结构一致性,在编辑区域之外的像素保持稳定,同时在最高 2K 分辨率下完成所请求的修改。可用于黑白照片上色、把白天场景改为黄昏等任务,而不会让面部、几何结构或细节遭到破坏。

单次提示最多 8 张一致性图像

模型可在单次提示中返回最多 8 张不同的图像,并在整组图像中保持角色和物体的连续性。这非常适合分镜、角色三视图、产品变体等场景,无需再依赖固定随机种子或复杂的提示词技巧。可以直接把这一批图像送入 Save Image 节点,或继续接入下游的视频工作流。 GPT-Image-2 一致性图像示例

混合工作流

GPT-Image-2 可以自然嵌入到混合工作流中:用它生成包含大量文字的关键画面,然后交给本地模型进行放大、风格化或视频生成 —— 在同一个工作流中,每个步骤都用最合适的模型。