メインコンテンツへスキップ
以下が翻訳結果です。 WanDancerVideo ノードは、WanDancer モデルによる動画生成のために、コンディショニングデータと空の潜在テンソルを準備します。このノードは、ポジティブコンディショニングとネガティブコンディショニングを、開始画像、マスク、CLIPビジョン埋め込み、オーディオ特徴量などのオプション入力と組み合わせて、生成される動画を制御します。

入力

パラメータ説明データ型必須範囲
positive動画生成をガイドするポジティブコンディショニング。CONDITIONINGはい
negative動画生成をガイドするネガティブコンディショニング。CONDITIONINGはい
vae開始画像を潜在空間にエンコードするために使用されるVAE。VAEはい
生成される動画の幅(ピクセル単位、デフォルト: 480)。INTはい16 ~ MAX_RESOLUTION (ステップ: 16)
高さ生成される動画の高さ(ピクセル単位、デフォルト: 832)。INTはい16 ~ MAX_RESOLUTION (ステップ: 16)
長さ生成される動画のフレーム数。WanDancer では 149 に設定する必要があります(デフォルト: 149)。INTはい1 ~ MAX_RESOLUTION (ステップ: 4)
clip_vision_output最初のフレームに対するCLIPビジョン埋め込み。CLIP_VISION_OUTPUTいいえ
clip_vision_output_ref参照画像に対するCLIPビジョン埋め込み。CLIP_VISION_OUTPUTいいえ
開始画像エンコードされる初期画像。指定された 長さ までの任意のフレーム数を指定できます。IMAGEいいえ
マスク開始画像に対する画像コンディショニングマスク。白い領域は保持され、黒い領域は生成されます。局所的な生成に使用されます。MASKいいえ
audio_encoder_outputオーディオエンコーダからの出力。オーディオ条件付き生成のためのオーディオ特徴量、fps、注入スケールを提供します。AUDIO_ENCODER_OUTPUTいいえ
パラメータ制約に関する注意事項:
  • start_imagemask の入力はオプションですが、一緒に使用することもできます。start_image が提供されると、それはエンコードされて潜在変数と連結されます。mask も提供された場合、開始画像のどの部分を保持するか(白)と、どの部分を再生成するか(黒)を制御します。mask が提供されない場合、開始画像領域全体がコンディショニングガイドとして使用されます。
  • clip_vision_outputclip_vision_output_ref の入力はオプションであり、最初のフレームと参照画像に視覚的なコンテキストを提供するために一緒に使用できます。
  • audio_encoder_output の入力はオプションであり、オーディオ条件付き生成のためのオーディオ特徴量を提供します。

出力

出力名説明データ型
negative追加データ(連結潜在変数、CLIPビジョン、オーディオ)が付加されたポジティブコンディショニング。CONDITIONING
latent追加データ(連結潜在変数、CLIPビジョン、オーディオ)が付加されたネガティブコンディショニング。CONDITIONING
latent指定された動画の長さ、高さ、幅に一致する次元を持つ空の潜在テンソル。LATENT
このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください! GitHub で編集

Source fingerprint (SHA-256): 7ab1b4662eb8d780295ea3a3e3139c64d81e03a979a293a481f82deaf1fc2f7e