このドキュメントは AI によって生成されました。誤りを発見された場合、または改善に関するご提案がある場合は、ぜひご貢献ください! GitHub で編集CosmosPredict2ImageToVideoLatent ノードは、動画生成のために画像から動画の潜在表現(latent representation)を作成します。このノードでは、空白の動画潜在表現を生成するほか、開始画像および終了画像を組み合わせて、指定された解像度および再生時間を持つ動画シーケンスを生成することも可能です。また、このノードは画像を動画処理に適した潜在空間フォーマットへエンコードする処理を担当します。
入力
| パラメーター | データ型 | 必須 | 範囲 | 説明 |
|---|---|---|---|---|
vae | VAE | はい | - | 画像を潜在空間へエンコードするために使用される VAE モデル |
width | INT | いいえ | 16 ~ MAX_RESOLUTION | 出力動画の幅(ピクセル単位、デフォルト値:848、16 の倍数である必要があります) |
height | INT | いいえ | 16 ~ MAX_RESOLUTION | 出力動画の高さ(ピクセル単位、デフォルト値:480、16 の倍数である必要があります) |
length | INT | いいえ | 1 ~ MAX_RESOLUTION | 動画シーケンスのフレーム数(デフォルト値:93、ステップ:4) |
batch_size | INT | いいえ | 1 ~ 4096 | 生成する動画シーケンスの数(デフォルト値:1) |
start_image | IMAGE | いいえ | - | 動画シーケンスの開始時に使用するオプションの画像 |
end_image | IMAGE | いいえ | - | 動画シーケンスの終了時に使用するオプションの画像 |
start_image および end_image のいずれも指定されない場合、ノードは空白の動画潜在表現を生成します。画像が指定された場合、それらはエンコードされ、動画シーケンスの先頭および/または末尾に配置され、適切なマスクが適用されます。
出力
| 出力名 | データ型 | 説明 |
|---|---|---|
samples | LATENT | 生成された動画潜在表現。エンコード済みの動画シーケンスを含みます |
noise_mask | LATENT | 生成処理中に潜在表現のどの部分を保持すべきかを示すマスク |