メインコンテンツへスキップ
Google Gemini は、Google が開発した強力な AI モデルであり、対話およびテキスト生成機能をサポートしています。現在、ComfyUI には Google Gemini API が統合されており、関連ノードを ComfyUI 上で直接使用して対話機能を実現できます。 本ガイドでは、対話機能の実装手順を段階的に解説します。
APIノードを使用するには、正しくログインしていることと、許可されたネットワーク環境で使用していることを確認する必要があります。APIノードの使用に必要な具体的な要件については、ドキュメントの「APIノードの概要」セクションをご参照ください。
ComfyUI が最新版に更新されていることを確認してください。このガイドで紹介するワークフローは、ワークフローテンプレートから入手できます。
テンプレート内に該当のワークフローが見つからない場合、ComfyUI のバージョンが古くなっている可能性があります。(デスクトップ版の更新は若干遅れることがあります)
ワークフローを読み込んだ際にノードが欠落している場合の主な原因:
  1. 最新の ComfyUI(Nightly 版)を使用していない
  2. 起動時に一部のノードのインポートに失敗している

Google Gemini Chat ワークフロー

1. ワークフローファイルのダウンロード

以下の JSON ファイルをダウンロードし、ComfyUI にドラッグ&ドロップすることで、対応するワークフローを読み込むことができます。

JSON 形式のワークフローファイルをダウンロード

2. ワークフロー実行の手順

OpenAI Chat Step Guide
対応するテンプレートでは、画像を解析して描画プロンプトへと変換するための「役割プロンプト(role prompt)」を生成するためのプロンプトを構築しています。
画像内の番号を参考にして、基本的なテキストから画像を生成するワークフローを実行してください:
  1. Load Image ノードで、AI に解析してほしい画像を読み込みます。
  2. (任意)必要に応じて、Google Gemini ノード内のプロンプトを編集し、AI に特定のタスクを実行させることができます。
  3. Run ボタンをクリックするか、ショートカットキー Ctrl(Windows)/Cmd(macOS) + Enter を押して対話を実行します。
  4. API からの結果が返信されるのを待った後、Preview Any ノードで AI が返した内容を確認できます。

3. 補足情報

  • 現在、ファイル入力ノード Gemini Input Files は、ファイルを事前に ComfyUI/input/ ディレクトリへアップロードする必要があります。このノードは現在改良中であり、更新後にテンプレートも修正する予定です。
  • ワークフローには、Batch Images を用いた入力のサンプルが含まれています。複数の画像を AI に解析させる必要がある場合は、手順図を参考に、対象ノードを右クリックしてモードを Always(常に実行) に設定することで有効化できます。