このドキュメントは AI によって生成されました。誤りを発見された場合、または改善に関するご提案がありましたら、ぜひご貢献ください! GitHub で編集TextEncodeZImageOmni ノードは、高度な条件付け(conditioning)ノードであり、テキストプロンプトに加えて、オプションの参照画像を含む条件フォーマットへとエンコードします。このフォーマットは、画像生成モデルに適しています。本ノードは最大で3枚の画像を処理可能であり、必要に応じてビジョンエンコーダーおよび/またはVAEを用いてこれらの画像をエンコードし、参照用の潜在表現(reference latents)を生成します。さらに、特定のテンプレート構造を用いて、こうした視覚的参照とテキストプロンプトを統合します。
入力
| パラメーター | データ型 | 必須 | 範囲 | 説明 |
|---|---|---|---|---|
clip | CLIP | はい | テキストプロンプトのトークン化およびエンコードに使用される CLIP モデルです。 | |
image_encoder | CLIPVision | いいえ | オプションのビジョンエンコーダーモデルです。指定された場合、入力画像のエンコードに使用され、生成された埋め込みベクトル(embeddings)が条件情報に追加されます。 | |
prompt | STRING | はい | エンコード対象のテキストプロンプトです。このフィールドは複数行入力および動的プロンプトをサポートします。 | |
auto_resize_images | BOOLEAN | いいえ | 有効化されている場合(デフォルト:True)、入力画像は VAE によるエンコード前に、そのピクセル面積に基づいて自動的にリサイズされます。 | |
vae | VAE | いいえ | オプションの VAE モデルです。指定された場合、入力画像を潜在表現(latent representations)へとエンコードし、これらの潜在表現は参照用の潜在変数(reference latents)として条件情報に追加されます。 | |
image1 | IMAGE | いいえ | 最初のオプションの参照画像です。 | |
image2 | IMAGE | いいえ | 2番目のオプションの参照画像です。 | |
image3 | IMAGE | いいえ | 3番目のオプションの参照画像です。 |
image1、image2、image3)を受け付けることができます。image_encoder および vae の入力は、少なくとも1枚の画像が提供された場合にのみ使用されます。auto_resize_images が True であり、かつ vae が接続されている場合、画像はエンコード前に、総ピクセル面積がおよそ 1024×1024 となるようにリサイズされます。
出力
| 出力名 | データ型 | 説明 |
|---|---|---|
CONDITIONING | CONDITIONING | 最終的な条件出力です。エンコード済みのテキストプロンプトを含み、参照画像が提供された場合には、エンコード済みの画像埋め込みベクトルおよび/または参照用の潜在変数も含まれます。 |