入力
| パラメータ | 説明 | データ型 | 必須 | 範囲 |
|---|---|---|---|---|
model | 同一性ガイダンスでパッチ適用されるモデル。 | MODEL | はい | - |
positive | ポジティブな条件付け入力。 | CONDITIONING | はい | - |
negative | ネガティブな条件付け入力。 | CONDITIONING | はい | - |
reference_audio | 話者同一性を転送するリファレンスオーディオクリップ。約5秒(トレーニング期間)を推奨します。これより短い、または長いクリップでは、音声同一性の転送が低下する可能性があります。 | AUDIO | はい | - |
audio_vae | リファレンスオーディオをエンコードするためのLTXV Audio VAE。 | VAE | はい | - |
identity_guidance_scale | 同一性ガイダンスの強さ。リファレンスなしで追加のフォワードパスを各ステップで実行し、話者同一性を増幅します。0に設定すると無効になります(追加パスなし)。(デフォルト:3.0) | FLOAT | いいえ | 0.0 - 100.0 |
start_percent | 同一性ガイダンスがアクティブになるシグマ範囲の開始位置。(デフォルト:0.0) | FLOAT | いいえ | 0.0 - 1.0 |
end_percent | 同一性ガイダンスがアクティブになるシグマ範囲の終了位置。(デフォルト:1.0) | FLOAT | いいえ | 0.0 - 1.0 |
出力
| 出力名 | 説明 | データ型 |
|---|---|---|
positive | 同一性ガイダンス機能でパッチ適用されたモデル。 | MODEL |
negative | エンコードされたリファレンスオーディオデータを含む、ポジティブな条件付け。 | CONDITIONING |
negative | エンコードされたリファレンスオーディオデータを含む、ネガティブな条件付け。 | CONDITIONING |
このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください! GitHub で編集
Source fingerprint (SHA-256):
0b87fb135ba8e752f4114cb47152503b0ec548eefcaa03f99f1cbdda6664874c