メインコンテンツへスキップ
このノードは、SDXLアーキテクチャ専用にカスタマイズされたCLIPモデルを用いてテキスト入力をエンコードするように設計されています。テキスト記述を処理するために、2つのエンコーダー(CLIP-LおよびCLIP-G)から構成されるデュアルエンコーダーシステムを採用しており、より正確な画像生成を実現します。

入力

パラメーターデータ型説明
clipCLIPテキストエンコードに使用されるCLIPモデルのインスタンスです。
widthINT画像の幅(ピクセル単位)を指定します。デフォルト値は1024です。
heightINT画像の高さ(ピクセル単位)を指定します。デフォルト値は1024です。
crop_wINTクロップ領域の幅(ピクセル単位)を指定します。デフォルト値は0です。
crop_hINTクロップ領域の高さ(ピクセル単位)を指定します。デフォルト値は0です。
target_widthINT出力画像の目標幅を指定します。デフォルト値は1024です。
target_heightINT出力画像の目標高さを指定します。デフォルト値は1024です。
text_gSTRING全体的なシーンを記述するためのグローバルなテキスト記述です。
text_lSTRING詳細な描写を行うためのローカルなテキスト記述です。

出力

パラメーターデータ型説明
CONDITIONINGCONDITIONING画像生成に必要な、エンコード済みのテキストおよび条件情報が含まれます。