入力
| パラメータ | 説明 | データ型 | 必須 | 範囲 |
|---|---|---|---|---|
positive | 動画生成をガイドするポジティブコンディショニング。 | CONDITIONING | はい | |
negative | 動画生成をガイドするネガティブコンディショニング。 | CONDITIONING | はい | |
vae | 開始画像を潜在空間にエンコードするために使用されるVAE。 | VAE | はい | |
幅 | 生成される動画の幅(ピクセル単位、デフォルト: 480)。 | INT | はい | 16 ~ MAX_RESOLUTION (ステップ: 16) |
高さ | 生成される動画の高さ(ピクセル単位、デフォルト: 832)。 | INT | はい | 16 ~ MAX_RESOLUTION (ステップ: 16) |
長さ | 生成される動画のフレーム数。WanDancer では 149 に設定する必要があります(デフォルト: 149)。 | INT | はい | 1 ~ MAX_RESOLUTION (ステップ: 4) |
clip_vision_output | 最初のフレームに対するCLIPビジョン埋め込み。 | CLIP_VISION_OUTPUT | いいえ | |
clip_vision_output_ref | 参照画像に対するCLIPビジョン埋め込み。 | CLIP_VISION_OUTPUT | いいえ | |
開始画像 | エンコードされる初期画像。指定された 長さ までの任意のフレーム数を指定できます。 | IMAGE | いいえ | |
マスク | 開始画像に対する画像コンディショニングマスク。白い領域は保持され、黒い領域は生成されます。局所的な生成に使用されます。 | MASK | いいえ | |
audio_encoder_output | オーディオエンコーダからの出力。オーディオ条件付き生成のためのオーディオ特徴量、fps、注入スケールを提供します。 | AUDIO_ENCODER_OUTPUT | いいえ |
start_imageとmaskの入力はオプションですが、一緒に使用することもできます。start_imageが提供されると、それはエンコードされて潜在変数と連結されます。maskも提供された場合、開始画像のどの部分を保持するか(白)と、どの部分を再生成するか(黒)を制御します。maskが提供されない場合、開始画像領域全体がコンディショニングガイドとして使用されます。clip_vision_outputとclip_vision_output_refの入力はオプションであり、最初のフレームと参照画像に視覚的なコンテキストを提供するために一緒に使用できます。audio_encoder_outputの入力はオプションであり、オーディオ条件付き生成のためのオーディオ特徴量を提供します。
出力
| 出力名 | 説明 | データ型 |
|---|---|---|
negative | 追加データ(連結潜在変数、CLIPビジョン、オーディオ)が付加されたポジティブコンディショニング。 | CONDITIONING |
latent | 追加データ(連結潜在変数、CLIPビジョン、オーディオ)が付加されたネガティブコンディショニング。 | CONDITIONING |
latent | 指定された動画の長さ、高さ、幅に一致する次元を持つ空の潜在テンソル。 | LATENT |
このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください! GitHub で編集
Source fingerprint (SHA-256):
7ab1b4662eb8d780295ea3a3e3139c64d81e03a979a293a481f82deaf1fc2f7e