メインコンテンツへスキップ
このドキュメントは AI によって生成されました。誤りを発見された場合、または改善に関するご提案がある場合は、ぜひご貢献ください! GitHub で編集する
CLIPTextEncodeHiDream ノードは、異なる言語モデルを用いて複数のテキスト入力を処理し、それらを単一の条件付け(conditioning)出力に統合します。このノードは、4つの異なるソース(CLIP-L、CLIP-G、T5-XXL、および LLaMA)から取得したテキストをトークン化し、スケジュールされたエンコーディング手法を用いてエンコードします。これにより、複数の言語モデルを同時に活用することで、より高度なテキスト条件付けが可能になります。

入力

パラメーターデータ型入力タイプデフォルト値範囲説明
clipCLIP必須入力--トークン化およびエンコーディングに使用される CLIP モデル
clip_lSTRING複数行テキスト--CLIP-L モデル処理用のテキスト入力
clip_gSTRING複数行テキスト--CLIP-G モデル処理用のテキスト入力
t5xxlSTRING複数行テキスト--T5-XXL モデル処理用のテキスト入力
llamaSTRING複数行テキスト--LLaMA モデル処理用のテキスト入力
注意: すべてのテキスト入力は、動的プロンプトおよび複数行テキスト入力をサポートしています。本ノードは正常に動作するために、上記の4つのテキストパラメーターすべてを指定する必要があります。各パラメーターは、スケジュールされたエンコーディングプロセスを通じて最終的な条件付け出力に寄与します。

出力

出力名データ型説明
CONDITIONINGCONDITIONINGすべての処理済みテキスト入力から得られる統合された条件付け出力