このドキュメントは AI によって生成されました。誤りを発見された場合、または改善に関するご提案がある場合は、ぜひご貢献ください! GitHub で編集Wan22FunControlToVideo ノードは、Wan 動画モデルアーキテクチャを用いて、動画生成のための条件入力(conditioning)および潜在表現(latent representation)を準備します。このノードは、正の条件入力と負の条件入力を処理し、さらに任意の参照画像(reference image)および制御動画(control video)を組み合わせることで、動画合成に必要な潜在空間表現を生成します。また、空間スケーリングおよび時間的次元(temporal dimensions)を適切に処理し、動画モデル向けの適切な条件データを生成します。
入力
| パラメーター | データ型 | 必須 | 範囲 | 説明 |
|---|---|---|---|---|
positive | CONDITIONING | はい | - | 動画生成をガイドするための正の条件入力 |
negative | CONDITIONING | はい | - | 動画生成をガイドするための負の条件入力 |
vae | VAE | はい | - | 画像を潜在空間へエンコードするために使用される VAE モデル |
width | INT | いいえ | 16 ~ MAX_RESOLUTION | 出力動画の幅(ピクセル単位)(デフォルト:832、ステップ:16) |
height | INT | いいえ | 16 ~ MAX_RESOLUTION | 出力動画の高さ(ピクセル単位)(デフォルト:480、ステップ:16) |
length | INT | いいえ | 1 ~ MAX_RESOLUTION | 動画シーケンス内のフレーム数(デフォルト:81、ステップ:4) |
batch_size | INT | いいえ | 1 ~ 4096 | 生成する動画シーケンスの数(デフォルト:1) |
ref_image | IMAGE | いいえ | - | 視覚的なガイドを提供するための任意の参照画像 |
control_video | IMAGE | いいえ | - | 生成プロセスをガイドするための任意の制御動画 |
length パラメーターは 4 フレーム単位のチャンクで処理され、ノードは潜在空間における時間的スケーリングを自動的に処理します。ref_image が指定された場合、参照潜在表現(reference latents)を通じて条件入力に影響を与えます。control_video が指定された場合、条件入力で使用される連結潜在表現(concat latent representation)に直接影響を与えます。
出力
| 出力名 | データ型 | 説明 |
|---|---|---|
positive | CONDITIONING | 動画固有の潜在データを含む修正済み正の条件入力 |
negative | CONDITIONING | 動画固有の潜在データを含む修正済み負の条件入力 |
latent | LATENT | 動画生成に適した次元を持つ空の潜在テンソル |