メインコンテンツへスキップ
以下が翻訳結果です。 CLIPLoader ノードは、テキストエンコーダモデル(CLIP、T5、または類似のもの)をファイルから読み込み、テキストプロンプトを数値表現に変換する必要がある他のノードで使用できるようにします。このノードは多種多様なモデルアーキテクチャをサポートしており、それぞれに特定のエンコーダタイプが必要です。

入力

パラメータ説明データ型必須範囲
clip名読み込むテキストエンコーダモデルのファイル名です。このファイルは ComfyUI/models/text_encoders/ または ComfyUI/models/clip/ ディレクトリに配置されている必要があります。STRINGはいtext_encoders フォルダ内にあるファイルのリスト
タイプ読み込むモデルのアーキテクチャタイプです。これにより、使用する特定のエンコーダのバリエーションが決定されます。デフォルトは "stable_diffusion" です。STRINGはい"stable_diffusion"
"stable_cascade"
"sd3"
"stable_audio"
"mochi"
"ltxv"
"pixart"
"cosmos"
"lumina2"
"wan"
"hidream"
"chroma"
"ace"
"omnigen2"
"qwen_image"
"hunyuan_image"
"flux2"
"ovis"
"longcat_image"
"cogvideox"
デバイスモデルを読み込むデバイスです。"default" は GPU が利用可能な場合は GPU を使用し、"cpu" は強制的に CPU で読み込みます。これは高度なオプションです(デフォルト: "default")。STRINGいいえ"default"
"cpu"

サポートされているタイプとエンコーダのマッピング

type パラメータは、特定のモデルアーキテクチャに対して正しいエンコーダを選択します。以下は一般的なマッピングです。
タイプエンコーダ
stable_diffusionclip-l
stable_cascadeclip-g
sd3t5 xxl / clip-g / clip-l
stable_audiot5 base
mochit5 xxl
cogvideoxt5 xxl(226トークンのパディング)
cosmosold t5 xxl
lumina2gemma 2 2B
wanumt5 xxl
hidreamllama-3.1(推奨)または t5
omnigen2qwen vl 2.5 3B

出力

出力名説明データ型
clip読み込まれたテキストエンコーダモデルです。テキストエンコーディングやコンディショニングのために他のノードに接続できる状態になっています。CLIP
このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください! GitHub で編集

Source fingerprint (SHA-256): 1051bfe5570dff81719682cb09938bae4c03e94e0e72f7a2be84867cccb48017