このドキュメントは AI によって生成されました。誤りを発見された場合、または改善に関するご提案がある場合は、ぜひご貢献ください! GitHub で編集するCLIPTextEncodeHiDream ノードは、異なる言語モデルを用いて複数のテキスト入力を処理し、それらを単一の条件付け(conditioning)出力に統合します。このノードは、4つの異なるソース(CLIP-L、CLIP-G、T5-XXL、および LLaMA)から取得したテキストをトークン化し、スケジュールされたエンコーディング手法を用いてエンコードします。これにより、複数の言語モデルを同時に活用することで、より高度なテキスト条件付けが可能になります。
入力
| パラメーター | データ型 | 入力タイプ | デフォルト値 | 範囲 | 説明 |
|---|---|---|---|---|---|
clip | CLIP | 必須入力 | - | - | トークン化およびエンコーディングに使用される CLIP モデル |
clip_l | STRING | 複数行テキスト | - | - | CLIP-L モデル処理用のテキスト入力 |
clip_g | STRING | 複数行テキスト | - | - | CLIP-G モデル処理用のテキスト入力 |
t5xxl | STRING | 複数行テキスト | - | - | T5-XXL モデル処理用のテキスト入力 |
llama | STRING | 複数行テキスト | - | - | LLaMA モデル処理用のテキスト入力 |
出力
| 出力名 | データ型 | 説明 |
|---|---|---|
CONDITIONING | CONDITIONING | すべての処理済みテキスト入力から得られる統合された条件付け出力 |