OpenAI GPT-Image-2 (Documentation Index
Fetch the complete documentation index at: https://docs.comfy.org/llms.txt
Use this file to discover all available pages before exploring further.
gpt-image-2) は OpenAI の最新画像モデルで、パートナーノード (Partner Nodes) を通じて ComfyUI で利用できます。OpenAI の画像モデルとして初めて、生成前に推論を行うモデルです。一発でサンプリングするのではなく、構図を計画し、結果を確認し、反復処理を行います。
このノードは次をサポートします:
- 文字情報、UI 要素、アイコン、インフォグラフィック、地図、スライド、漫画コマ割りなどの密度の高い表現に強い text-to-image 生成
- 最大 2K 解像度で構造を維持したままの画像編集
- 1 つのプロンプトから、キャラクターやオブジェクトの一貫性を保った最大 8 枚の画像生成
ノード概要
GPT-Image-2 は、ノードライブラリの OpenAI GPT Image 1.5 ノードのmodel オプションから選択します。このノードは OpenAI の画像生成 API を同期的に呼び出し、説明に一致する画像を返します。
はじめに
- ComfyUI を最新版 (v0.19.4 以降) に更新するか、Comfy Cloud を使用してください。
- ノードライブラリで OpenAI GPT Image 1.5 を検索し、ノードを追加します。
modelフィールドをgpt-image-2に設定します。
利用可能なワークフロー
Text to image (T2I)
GPT-Image-2 の推論駆動のコンポジション能力を活かして、テキストプロンプトから画像を生成します。Comfy Cloud で Text-to-Image を実行
Comfy Cloud 上ですぐに Text-to-Image ワークフローを試せます。
Text-to-Image ワークフローをダウンロード
ワークフローの JSON をダウンロードします。
Image edit
入力画像に対して、最大 2K 解像度で構造的な忠実度を保ちながら編集を行います。Comfy Cloud で Image Edit を実行
Comfy Cloud 上ですぐに Image Edit ワークフローを試せます。
Image Edit ワークフローをダウンロード
ワークフローの JSON をダウンロードします。
主な機能
推論駆動の生成
GPT-Image-2 はレンダリング前に構図を計画します。そのため、これまで画像モデルが苦手としてきたプロンプト ── 例えば「11pt Helvetica で中央揃え、7 項目の箇条書きが入ったポスター」── でもクリーンな出力が得られ、密度の高い文字、小さな UI 要素、アイコン、インフォグラフィック、地図、スライドなどに適しています。必要な部分だけを変える画像編集
GPT-Image-2 は局所的な編集を構造的な忠実度を保ちながら実行し、編集対象の外側はピクセル単位で安定させたまま、最大 2K 解像度で要求された変更を反映します。白黒写真のカラー化や、昼のシーンを夕暮れに変えるといったタスクで、顔・形状・細部を破綻させることなく適用できます。1 つのプロンプトから一貫性のある 8 枚
モデルは 1 つのプロンプトから最大 8 枚の異なる画像 を返し、シリーズ全体でキャラクターやオブジェクトの一貫性を保ちます。絵コンテ、設定資料、キャラクターターンアラウンド、製品バリエーションなど、これまでシード固定や凝ったプロンプト調整が必要だったユースケースを、1 ノードでまかなえます。バッチをそのままSave Image ノードに流したり、後段の動画ワークフローに接続したりできます。