メインコンテンツへスキップ
このドキュメントは AI によって生成されました。誤りを発見された場合、または改善に関するご提案がある場合は、ぜひご貢献ください! GitHub で編集
CosmosPredict2ImageToVideoLatent ノードは、動画生成のために画像から動画の潜在表現(latent representation)を作成します。このノードでは、空白の動画潜在表現を生成するほか、開始画像および終了画像を組み合わせて、指定された解像度および再生時間を持つ動画シーケンスを生成することも可能です。また、このノードは画像を動画処理に適した潜在空間フォーマットへエンコードする処理を担当します。

入力

パラメーターデータ型必須範囲説明
vaeVAEはい-画像を潜在空間へエンコードするために使用される VAE モデル
widthINTいいえ16 ~ MAX_RESOLUTION出力動画の幅(ピクセル単位、デフォルト値:848、16 の倍数である必要があります)
heightINTいいえ16 ~ MAX_RESOLUTION出力動画の高さ(ピクセル単位、デフォルト値:480、16 の倍数である必要があります)
lengthINTいいえ1 ~ MAX_RESOLUTION動画シーケンスのフレーム数(デフォルト値:93、ステップ:4)
batch_sizeINTいいえ1 ~ 4096生成する動画シーケンスの数(デフォルト値:1)
start_imageIMAGEいいえ-動画シーケンスの開始時に使用するオプションの画像
end_imageIMAGEいいえ-動画シーケンスの終了時に使用するオプションの画像
注意: start_image および end_image のいずれも指定されない場合、ノードは空白の動画潜在表現を生成します。画像が指定された場合、それらはエンコードされ、動画シーケンスの先頭および/または末尾に配置され、適切なマスクが適用されます。

出力

出力名データ型説明
samplesLATENT生成された動画潜在表現。エンコード済みの動画シーケンスを含みます
noise_maskLATENT生成処理中に潜在表現のどの部分を保持すべきかを示すマスク