メインコンテンツへスキップ
このドキュメントはAIによって生成されました。誤りや改善の提案がありましたら、ぜひご協力ください。GitHubで編集する TextEncodeZImageOmniノードは、テキストプロンプトとオプションの参照画像を、画像生成モデルに適した条件付け形式にエンコードする高度な条件付けノードです。最大3枚の画像を処理し、オプションでビジョンエンコーダーやVAEを使用して参照潜在表現を生成し、特定のテンプレート構造を用いてこれらの視覚的参照をテキストプロンプトと統合します。

入力

パラメータ説明データ型必須範囲
clipテキストプロンプトのトークン化とエンコードに使用するCLIPモデルです。CLIPはい
画像エンコーダオプションのビジョンエンコーダーモデルです。指定された場合、入力画像のエンコードに使用され、結果の埋め込みが条件付けに追加されます。CLIPVisionいいえ
プロンプトエンコードするテキストプロンプトです。このフィールドは複数行入力と動的プロンプトをサポートしています。STRINGはい
画像自動リサイズ有効(デフォルト:True)の場合、VAEでエンコードする前に、入力画像がピクセル面積に基づいて自動的にリサイズされます。BOOLEANいいえ
vaeオプションのVAEモデルです。指定された場合、入力画像を潜在表現にエンコードするために使用され、参照潜在表現として条件付けに追加されます。VAEいいえ
画像11つ目のオプションの参照画像です。IMAGEいいえ
画像22つ目のオプションの参照画像です。IMAGEいいえ
画像33つ目のオプションの参照画像です。IMAGEいいえ
注意: このノードは最大3枚の画像(image1image2image3)を受け入れることができます。image_encodervaeの入力は、少なくとも1枚の画像が提供された場合にのみ使用されます。auto_resize_imagesがTrueでvaeが接続されている場合、画像はエンコード前に総ピクセル面積が1024x1024に近くなるようにリサイズされます。

出力

出力名説明データ型
CONDITIONING最終的な条件付け出力です。エンコードされたテキストプロンプトを含み、画像が提供された場合はエンコードされた画像埋め込みや参照潜在表現も含まれる場合があります。CONDITIONING
このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください! GitHub で編集

Source fingerprint (SHA-256): daa4205acdf72503180eeedb4142708d239d4ff0f689012a298264ae2d8ea949