メインコンテンツへスキップ
このドキュメントは AI によって生成されました。誤りや改善の提案がありましたら、ぜひご協力ください! GitHub で編集する Wan22ImageToVideoLatent ノードは、画像からビデオの潜在表現を生成します。指定された寸法で空白のビデオ潜在空間を作成し、オプションで開始画像シーケンスを先頭フレームにエンコードできます。開始画像が提供されると、画像を潜在空間にエンコードし、インペイント領域に対応するノイズマスクを生成します。

入力

パラメータ説明データ型必須範囲
vae画像を潜在空間にエンコードするために使用されるVAEモデルVAEはい-
出力ビデオの幅(ピクセル単位)(デフォルト:1280、ステップ:32)INTはい32 ~ MAX_RESOLUTION
高さ出力ビデオの高さ(ピクセル単位)(デフォルト:704、ステップ:32)INTはい32 ~ MAX_RESOLUTION
長さビデオシーケンスのフレーム数(デフォルト:49、ステップ:4)INTはい1 ~ MAX_RESOLUTION
バッチサイズ生成するバッチ数(デフォルト:1)INTはい1 ~ 4096
開始画像ビデオ潜在表現にエンコードするオプションの開始画像シーケンスIMAGEいいえ-
注記: start_image が提供されると、ノードは画像シーケンスを潜在空間の先頭フレームにエンコードし、対応するノイズマスクを生成します。widthheight パラメータは、適切な潜在空間の次元を得るために16で割り切れる必要があります。length パラメータはビデオ潜在表現のフレーム数を決定します。潜在空間の時間次元は ((length - 1) // 4) + 1 として計算されます。

出力

出力名説明データ型
samples生成されたビデオ潜在表現LATENT
noise_mask生成中にどの領域をノイズ除去すべきかを示すノイズマスクLATENT
このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください! GitHub で編集

Source fingerprint (SHA-256): 0f27e20bcc63f0dd224cda0fa26ee676c42898ac74fcfbe0a2b591def933689c