メインコンテンツへスキップ
このドキュメントは AI によって生成されました。誤りを発見された場合、または改善に関するご提案がありましたら、ぜひご貢献ください! GitHub で編集
TextEncodeZImageOmni ノードは、高度な条件付け(conditioning)ノードであり、テキストプロンプトに加えて、オプションの参照画像を含む条件フォーマットへとエンコードします。このフォーマットは、画像生成モデルに適しています。本ノードは最大で3枚の画像を処理可能であり、必要に応じてビジョンエンコーダーおよび/またはVAEを用いてこれらの画像をエンコードし、参照用の潜在表現(reference latents)を生成します。さらに、特定のテンプレート構造を用いて、こうした視覚的参照とテキストプロンプトを統合します。

入力

パラメーターデータ型必須範囲説明
clipCLIPはいテキストプロンプトのトークン化およびエンコードに使用される CLIP モデルです。
image_encoderCLIPVisionいいえオプションのビジョンエンコーダーモデルです。指定された場合、入力画像のエンコードに使用され、生成された埋め込みベクトル(embeddings)が条件情報に追加されます。
promptSTRINGはいエンコード対象のテキストプロンプトです。このフィールドは複数行入力および動的プロンプトをサポートします。
auto_resize_imagesBOOLEANいいえ有効化されている場合(デフォルト:True)、入力画像は VAE によるエンコード前に、そのピクセル面積に基づいて自動的にリサイズされます。
vaeVAEいいえオプションの VAE モデルです。指定された場合、入力画像を潜在表現(latent representations)へとエンコードし、これらの潜在表現は参照用の潜在変数(reference latents)として条件情報に追加されます。
image1IMAGEいいえ最初のオプションの参照画像です。
image2IMAGEいいえ2番目のオプションの参照画像です。
image3IMAGEいいえ3番目のオプションの参照画像です。
注意: このノードは最大で3枚の画像(image1image2image3)を受け付けることができます。image_encoder および vae の入力は、少なくとも1枚の画像が提供された場合にのみ使用されます。auto_resize_images が True であり、かつ vae が接続されている場合、画像はエンコード前に、総ピクセル面積がおよそ 1024×1024 となるようにリサイズされます。

出力

出力名データ型説明
CONDITIONINGCONDITIONING最終的な条件出力です。エンコード済みのテキストプロンプトを含み、参照画像が提供された場合には、エンコード済みの画像埋め込みベクトルおよび/または参照用の潜在変数も含まれます。