このドキュメントは AI によって生成されました。誤りを発見した場合や改善に関するご提案がありましたら、ぜひ貢献してください! GitHub で編集WanFirstLastFrameToVideo ノードは、開始フレームと終了フレームをテキストプロンプトと組み合わせることで、動画生成のための条件付け(conditioning)を生成します。このノードは、最初と最後のフレームをエンコードし、生成プロセスをガイドするマスクを適用するとともに、利用可能な場合は CLIP ビジョン特徴量も統合することで、動画生成のための潜在表現(latent representation)を生成します。また、このノードは、指定された開始点と終了点の間で一貫性のある動画シーケンスを生成するための、正方向および負方向の条件付けを動画モデルに提供します。
入力
| パラメーター | データ型 | 必須 | 範囲 | 説明 |
|---|---|---|---|---|
positive | CONDITIONING | はい | - | 動画生成をガイドするための正方向のテキスト条件 |
negative | CONDITIONING | はい | - | 動画生成をガイドするための負方向のテキスト条件 |
vae | VAE | はい | - | 画像を潜在空間へエンコードする際に使用される VAE モデル |
width | INT | いいえ | 16 ~ MAX_RESOLUTION | 出力動画の幅(デフォルト:832、ステップ:16) |
height | INT | いいえ | 16 ~ MAX_RESOLUTION | 出力動画の高さ(デフォルト:480、ステップ:16) |
length | INT | いいえ | 1 ~ MAX_RESOLUTION | 動画シーケンス内のフレーム数(デフォルト:81、ステップ:4) |
batch_size | INT | いいえ | 1 ~ 4096 | 同時に生成する動画の数(デフォルト:1) |
clip_vision_start_image | CLIP_VISION_OUTPUT | いいえ | - | 開始画像から抽出された CLIP ビジョン特徴量 |
clip_vision_end_image | CLIP_VISION_OUTPUT | いいえ | - | 終了画像から抽出された CLIP ビジョン特徴量 |
start_image | IMAGE | いいえ | - | 動画シーケンスの開始フレーム画像 |
end_image | IMAGE | いいえ | - | 動画シーケンスの終了フレーム画像 |
start_image および end_image の両方が提供された場合、このノードはこれらの 2 つのフレーム間で遷移する動画シーケンスを生成します。clip_vision_start_image および clip_vision_end_image はオプションのパラメーターですが、これらが提供された場合には、それぞれの CLIP ビジョン特徴量が連結され、正方向および負方向の条件付けの両方に適用されます。
出力
| 出力名 | データ型 | 説明 |
|---|---|---|
positive | CONDITIONING | 動画フレームのエンコーディングおよび CLIP ビジョン特徴量が適用された正方向の条件付け |
negative | CONDITIONING | 動画フレームのエンコーディングおよび CLIP ビジョン特徴量が適用された負方向の条件付け |
latent | LATENT | 指定された動画パラメーターに一致する次元を持つ空の潜在テンソル |