CLIPTextEncodeHunyuanDiT ノードの主な機能は、入力テキストをモデルが理解可能な形式に変換することです。これは、HunyuanDiT モデルの二重テキストエンコーダー構造に特化して設計された高度な条件付けノードです。その主な役割は「翻訳者」のようなものであり、ユーザーのテキスト記述を AI モデルが理解できる「機械語」へと変換します。
bert および mt5xl の入力は、それぞれ異なるタイプのプロンプト入力を推奨します。
入力
| パラメーター | データ型 | 説明 |
|---|---|---|
clip | CLIP | テキストのトークン化およびエンコーディングに使用される CLIP モデルのインスタンスで、条件生成の核となる要素です。 |
bert | STRING | エンコーディング対象のテキスト入力です。フレーズやキーワードを推奨し、複数行および動的プロンプトをサポートします。 |
mt5xl | STRING | もう一方のエンコーディング対象テキスト入力です。複数行および動的プロンプト(多言語対応)をサポートし、完全な文や複雑な記述の使用が可能です。 |
出力
| パラメーター | データ型 | 説明 |
|---|---|---|
CONDITIONING | CONDITIONING | 生成タスクにおいて後続処理に用いられる、エンコード済みの条件出力です。 |