Wan22ImageToVideoLatent - ComfyUI Built-in Node Documentation

このドキュメントは AI によって生成されました。誤りや改善の提案がありましたら、ぜひご協力ください！ GitHub で編集する Wan22ImageToVideoLatent ノードは、画像からビデオの潜在表現を生成します。指定された寸法で空白のビデオ潜在空間を作成し、オプションで開始画像シーケンスを先頭フレームにエンコードできます。開始画像が提供されると、画像を潜在空間にエンコードし、インペイント領域に対応するノイズマスクを生成します。

入力

パラメータ	説明	データ型	必須	範囲
`vae`	画像を潜在空間にエンコードするために使用されるVAEモデル	VAE	はい	-
`幅`	出力ビデオの幅（ピクセル単位）（デフォルト：1280、ステップ：32）	INT	はい	32 ～ MAX_RESOLUTION
`高さ`	出力ビデオの高さ（ピクセル単位）（デフォルト：704、ステップ：32）	INT	はい	32 ～ MAX_RESOLUTION
`長さ`	ビデオシーケンスのフレーム数（デフォルト：49、ステップ：4）	INT	はい	1 ～ MAX_RESOLUTION
`バッチサイズ`	生成するバッチ数（デフォルト：1）	INT	はい	1 ～ 4096
`開始画像`	ビデオ潜在表現にエンコードするオプションの開始画像シーケンス	IMAGE	いいえ	-

注記： start_image が提供されると、ノードは画像シーケンスを潜在空間の先頭フレームにエンコードし、対応するノイズマスクを生成します。width と height パラメータは、適切な潜在空間の次元を得るために16で割り切れる必要があります。length パラメータはビデオ潜在表現のフレーム数を決定します。潜在空間の時間次元は ((length - 1) // 4) + 1 として計算されます。

出力

出力名	説明	データ型
`samples`	生成されたビデオ潜在表現	LATENT
`noise_mask`	生成中にどの領域をノイズ除去すべきかを示すノイズマスク	LATENT

このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください！ GitHub で編集

Source fingerprint (SHA-256): 0f27e20bcc63f0dd224cda0fa26ee676c42898ac74fcfbe0a2b591def933689c

​入力

​出力

入力

出力