CosmosImageToVideoLatent - ComfyUI Built-in Node Documentation

CosmosImageToVideoLatent ノードは、入力画像からビデオの潜在表現を生成します。空のビデオ潜在表現を作成し、オプションで開始画像や終了画像をビデオシーケンスの先頭フレームや末尾フレームにエンコードします。画像が提供された場合、生成中に潜在表現のどの部分を保持すべきかを示す、対応するノイズマスクも作成します。

入力

パラメータ	説明	データ型	必須	範囲
`vae`	画像を潜在空間にエンコードするために使用されるVAEモデル	VAE	はい	-
`幅`	出力ビデオの幅（ピクセル単位）（デフォルト：1280）	INT	はい	16 ～ MAX_RESOLUTION
`高さ`	出力ビデオの高さ（ピクセル単位）（デフォルト：704）	INT	はい	16 ～ MAX_RESOLUTION
`長さ`	ビデオシーケンスのフレーム数（デフォルト：121）	INT	はい	1 ～ MAX_RESOLUTION
`バッチサイズ`	生成する潜在バッチの数（デフォルト：1）	INT	はい	1 ～ 4096
`開始画像`	ビデオシーケンスの先頭にエンコードするオプションの画像	IMAGE	いいえ	-
`終了画像`	ビデオシーケンスの末尾にエンコードするオプションの画像	IMAGE	いいえ	-

注記： start_image と end_image の両方が提供されない場合、ノードはノイズマスクなしの空の潜在表現を返します。いずれかの画像が提供された場合、潜在表現の該当部分がエンコードされ、それに応じてマスクされます。

出力

出力名	説明	データ型
`latent`	オプションでエンコードされた画像と対応するノイズマスクを含む、生成されたビデオ潜在表現	LATENT

このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください！ GitHub で編集

Source fingerprint (SHA-256): 31ce4dc577c672e0b3dc0bfb6644b2ef7ab737f6c4ee5e0677973b6a4efdd66d

​入力

​出力

入力

出力