メインコンテンツへスキップ
このドキュメンテーションは AI によって生成されました。誤りを発見された場合、または改善に関するご提案がある場合は、ぜひご貢献ください!GitHub で編集する
Wan22ImageToVideoLatent ノードは、画像から動画の潜在表現(latent representation)を生成します。このノードは、指定されたサイズの空白の動画潜在空間を作成し、オプションで開始画像シーケンスを先頭のフレームにエンコードすることができます。開始画像が提供された場合、ノードはその画像を潜在空間にエンコードし、インペイント(修復)領域に対応するノイズマスクを生成します。

入力

パラメーターデータ型必須範囲説明
vaeVAEはい-画像を潜在空間にエンコードするために使用される VAE モデル
widthINTいいえ32 ~ MAX_RESOLUTION出力動画の幅(ピクセル単位)。デフォルト値:1280、ステップ:32
heightINTいいえ32 ~ MAX_RESOLUTION出力動画の高さ(ピクセル単位)。デフォルト値:704、ステップ:32
lengthINTいいえ1 ~ MAX_RESOLUTION動画シーケンスのフレーム数。デフォルト値:49、ステップ:4
batch_sizeINTいいえ1 ~ 4096生成するバッチ数。デフォルト値:1
start_imageIMAGEいいえ-オプションの開始画像シーケンス。動画の潜在空間にエンコードされます
注意: start_image を指定した場合、ノードは画像シーケンスを潜在空間の先頭フレームにエンコードし、対応するノイズマスクを生成します。潜在空間の適切な次元を確保するため、width および height の値は 16 で割り切れる必要があります。

出力

出力名データ型説明
samplesLATENT生成された動画の潜在表現
noise_maskLATENT生成時にどの領域をデノイズするかを示すノイズマスク