メインコンテンツへスキップ
CosmosPredict2ImageToVideoLatent ノードは、動画生成のために画像からビデオ潜在表現を作成します。空白のビデオ潜在表現を生成したり、開始画像と終了画像を組み込んで、指定された寸法と長さの動画シーケンスを作成することができます。このノードは、画像を動画処理に適した潜在空間フォーマットにエンコードします。

入力

パラメータ説明データ型必須範囲
vae画像を潜在空間にエンコードするために使用されるVAEモデルVAEはい-
width出力動画の幅(ピクセル単位、デフォルト:848、16で割り切れる必要があります)INTいいえ16 ~ MAX_RESOLUTION
height出力動画の高さ(ピクセル単位、デフォルト:480、16で割り切れる必要があります)INTいいえ16 ~ MAX_RESOLUTION
length動画シーケンスのフレーム数(デフォルト:93、ステップ:4)INTいいえ1 ~ MAX_RESOLUTION
batch_size生成する動画シーケンスの数(デフォルト:1)INTいいえ1 ~ 4096
start_image動画シーケンスの開始画像(オプション)IMAGEいいえ-
end_image動画シーケンスの終了画像(オプション)IMAGEいいえ-
注記: start_imageend_image の両方が指定されていない場合、ノードは空白のビデオ潜在表現を生成します。画像が指定された場合、それらはエンコードされ、適切なマスキングとともに動画シーケンスの開始位置や終了位置に配置されます。

出力

出力名説明データ型
samplesエンコードされた動画シーケンスを含む、生成されたビデオ潜在表現LATENT
noise_mask生成中に潜在表現のどの部分を保持すべきかを示すマスクLATENT
このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください! GitHub で編集

Source fingerprint (SHA-256): 55fab16180c0e3fa254bcc77694dbc666810b28522e61b9c613f720fae66bd0c