メインコンテンツへスキップ
このドキュメントは AI によって生成されました。誤りを発見された場合、または改善のご提案がある場合は、ぜひご貢献ください! GitHub で編集
Kandinsky5ImageToVideo ノードは、Kandinsky モデルを用いた動画生成のために、条件付けデータおよび潜在空間データを準備します。このノードは空の動画潜在テンソルを作成し、オプションとして開始画像をエンコードして生成される動画の初期フレームをガイドすることができ、これに応じて正の条件付けおよび負の条件付けを修正します。

入力

パラメーターデータ型必須範囲説明
positiveCONDITIONINGはいN/A動画生成をガイドするための正の条件付けプロンプトです。
negativeCONDITIONINGはいN/A動画生成から特定の概念を除外するための負の条件付けプロンプトです。
vaeVAEはいN/Aオプションの開始画像を潜在空間へエンコードするために使用される VAE モデルです。
widthINTいいえ16~8192(ステップ 16)出力動画の幅(ピクセル単位)(デフォルト:768)。
heightINTいいえ16~8192(ステップ 16)出力動画の高さ(ピクセル単位)(デフォルト:512)。
lengthINTいいえ1~8192(ステップ 4)動画のフレーム数(デフォルト:121)。
batch_sizeINTいいえ1~4096同時に生成する動画シーケンスの数(デフォルト:1)。
start_imageIMAGEいいえN/Aオプションの開始画像です。指定した場合、この画像がエンコードされ、モデル出力の潜在テンソルのノイズを含む初期部分を置き換えるために使用されます。
注意: start_image が指定された場合、この画像は自動的に双線形補間により、指定された width および height にリサイズされます。また、画像バッチの先頭 length フレームがエンコードに使用されます。エンコードされた潜在表現は、その後 positive および negative の両方の条件付けに注入され、動画の初期外観をガイドします。

出力

出力名データ型説明
positiveCONDITIONING変更後の正の条件付け。開始画像のエンコード済みデータが反映されている場合があります。
negativeCONDITIONING変更後の負の条件付け。開始画像のエンコード済みデータが反映されている場合があります。
latentLATENT指定された次元に適合する形状の、ゼロで初期化された空の動画潜在テンソルです。
cond_latentLATENT提供された開始画像の、ノイズのないエンコード済み潜在表現です。これは内部的に、生成された動画潜在テンソルのノイズを含む初期部分を置き換えるために使用されます。