メインコンテンツへスキップ
このドキュメントは AI によって生成されました。誤りを発見された場合、または改善に関するご提案がありましたら、ぜひご貢献ください! GitHub で編集する
CosmosImageToVideoLatent ノードは、入力画像から動画の潜在表現(latent)を生成します。このノードは、空白の動画潜在表現を生成し、必要に応じて開始画像および/または終了画像を動画シーケンスの先頭および/または末尾のフレームにエンコードします。画像が指定された場合、生成時に潜在表現のどの部分を保持すべきかを示す対応するノイズマスクも作成されます。

入力

パラメーターデータ型必須範囲説明
vaeVAEはい-画像を潜在空間へエンコードする際に使用される VAE モデル
widthINTいいえ16 ~ MAX_RESOLUTION出力動画の幅(ピクセル単位)(デフォルト:1280)
heightINTいいえ16 ~ MAX_RESOLUTION出力動画の高さ(ピクセル単位)(デフォルト:704)
lengthINTいいえ1 ~ MAX_RESOLUTION動画シーケンスのフレーム数(デフォルト:121)
batch_sizeINTいいえ1 ~ 4096生成する潜在表現のバッチ数(デフォルト:1)
start_imageIMAGEいいえ-動画シーケンスの先頭でエンコードするオプションの画像
end_imageIMAGEいいえ-動画シーケンスの末尾でエンコードするオプションの画像
注意: start_imageend_image も指定されない場合、ノードはノイズマスクを含まない空白の潜在表現を返します。いずれかの画像が指定された場合、潜在表現の対応する領域がエンコードされ、それに応じたマスクが作成されます。

出力

出力名データ型説明
latentLATENT生成された動画の潜在表現。オプションでエンコードされた画像および対応するノイズマスクを含みます