このドキュメンテーションは AI によって生成されました。誤りを発見された場合、または改善に関するご提案がある場合は、ぜひご貢献ください!GitHub で編集するWan22ImageToVideoLatent ノードは、画像から動画の潜在表現(latent representation)を生成します。このノードは、指定されたサイズの空白の動画潜在空間を作成し、オプションで開始画像シーケンスを先頭のフレームにエンコードすることができます。開始画像が提供された場合、ノードはその画像を潜在空間にエンコードし、インペイント(修復)領域に対応するノイズマスクを生成します。
入力
| パラメーター | データ型 | 必須 | 範囲 | 説明 |
|---|---|---|---|---|
vae | VAE | はい | - | 画像を潜在空間にエンコードするために使用される VAE モデル |
width | INT | いいえ | 32 ~ MAX_RESOLUTION | 出力動画の幅(ピクセル単位)。デフォルト値:1280、ステップ:32 |
height | INT | いいえ | 32 ~ MAX_RESOLUTION | 出力動画の高さ(ピクセル単位)。デフォルト値:704、ステップ:32 |
length | INT | いいえ | 1 ~ MAX_RESOLUTION | 動画シーケンスのフレーム数。デフォルト値:49、ステップ:4 |
batch_size | INT | いいえ | 1 ~ 4096 | 生成するバッチ数。デフォルト値:1 |
start_image | IMAGE | いいえ | - | オプションの開始画像シーケンス。動画の潜在空間にエンコードされます |
start_image を指定した場合、ノードは画像シーケンスを潜在空間の先頭フレームにエンコードし、対応するノイズマスクを生成します。潜在空間の適切な次元を確保するため、width および height の値は 16 で割り切れる必要があります。
出力
| 出力名 | データ型 | 説明 |
|---|---|---|
samples | LATENT | 生成された動画の潜在表現 |
noise_mask | LATENT | 生成時にどの領域をデノイズするかを示すノイズマスク |