メインコンテンツへスキップ
TrainLoraNodeは、提供された潜在変数と条件付けデータを使用して、拡散モデル上でLoRA(低ランク適応)モデルを作成し、トレーニングします。カスタムトレーニングパラメータ、オプティマイザ、損失関数を使用してモデルをファインチューニングできます。このノードは、トレーニングされたLoRA重み、損失履歴マップ、および完了した総トレーニングステップ数を出力します。

入力

パラメータ説明データ型必須範囲
モデルLoRAをトレーニングするモデル。MODELはい-
潜在変数トレーニングに使用する潜在変数。モデルのデータセット/入力として機能します。LATENTはい-
ポジティブ条件付けトレーニングに使用するポジティブ条件付け。CONDITIONINGはい-
バッチサイズトレーニングに使用するバッチサイズ(デフォルト: 1)。INTはい1-10000
勾配蓄積ステップ数トレーニングに使用する勾配蓄積ステップ数(デフォルト: 1)。INTはい1-1024
ステップ数LoRAをトレーニングするステップ数(デフォルト: 16)。INTはい1-100000
学習率トレーニングに使用する学習率(デフォルト: 0.0005)。FLOATはい0.0000001-1.0
ランクLoRAレイヤーのランク(デフォルト: 8)。INTはい1-128
オプティマイザトレーニングに使用するオプティマイザ(デフォルト: “AdamW”)。COMBOはい”AdamW"
"Adam"
"SGD"
"RMSprop”
損失関数トレーニングに使用する損失関数(デフォルト: “MSE”)。COMBOはい”MSE"
"L1"
"Huber"
"SmoothL1”
シードトレーニングに使用するシード(LoRA重み初期化とノイズサンプリング用のジェネレータで使用)(デフォルト: 0)。INTはい0-18446744073709551615
training_dtypeトレーニングに使用するデータ型。‘none’はモデルのネイティブ計算データ型を保持し、上書きしません。fp16モデルの場合、GradScalerが自動的に有効になります(デフォルト: “bf16”)。COMBOはい”bf16"
"fp32"
"none”
lora_dtypeLoRAに使用するデータ型(デフォルト: “bf16”)。COMBOはい”bf16"
"fp32”
quantized_backwardtraining_dtypeが’none’で量子化モデルをトレーニングする場合、有効にすると逆伝播で量子化行列乗算を使用します(デフォルト: False)。BOOLEANはい-
algorithmトレーニングに使用するアルゴリズム。COMBOはい複数のオプションが利用可能
gradient_checkpointingトレーニングに勾配チェックポイントを使用するかどうか(デフォルト: True)。BOOLEANはい-
チェックポイント深度勾配チェックポイントの深さレベル(デフォルト: 1)。INTはい1-5
オフロードトレーニング中にモデル重みをCPUにオフロードしてGPUメモリを節約するかどうか(デフォルト: False)。BOOLEANはい-
existing_lora追加する既存のLoRA。新しいLoRAの場合はNoneに設定します(デフォルト: “[None]”)。COMBOはい複数のオプションが利用可能
バケットモード解像度バケットモードを有効にします。有効にすると、ResolutionBucketノードから事前にバケット化された潜在変数を期待します(デフォルト: False)。BOOLEANはい-
bypass_modeトレーニングのバイパスモードを有効にします。有効にすると、アダプターは重み変更ではなくフォワードフックを介して適用されます。重みを直接変更できない量子化モデルに役立ちます(デフォルト: False)。BOOLEANはい-
注記: ポジティブ条件付け入力の数は、潜在画像の数と一致する必要があります。複数の画像に対して1つのポジティブ条件付けのみが提供された場合、すべての画像に対して自動的に繰り返されます。 training_dtypeに関する注記: “none”に設定すると、モデルのネイティブ計算データ型が保持されます。fp16モデルの場合、勾配計算中のアンダーフローを防ぐためにGradScalerが自動的に有効になります。fp16_accumulationも有効になっている場合(--fastフラグ経由)、この組み合わせは数値的に不安定になり、NaN値を引き起こす可能性があります。 quantized_backwardに関する注記: このパラメータは、training_dtypeが”none”に設定され、モデルが量子化モデルである場合にのみ関連します。逆伝播中に量子化行列乗算を有効にします。 bypass_modeに関する注記: 有効にすると、アダプターはモデル重みを直接変更するのではなく、フォワードフックを介して適用されます。これは、重みを直接変更できない量子化モデルに特に役立ちます。

出力

出力名説明データ型
損失マップトレーニングされたLoRA重み。保存したり、他のモデルに適用したりできます。LORA_MODEL
ステップ数時間経過に伴うトレーニング損失値を含む辞書。LOSS_MAP
ステップ数完了したトレーニングステップの総数(既存のLoRAからの以前のステップを含む)。INT
このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください! GitHub で編集

Source fingerprint (SHA-256): df315ef416ff3ce81e6a526af2c4e5115980e6c35830825967e7189d4f8541d8