- 目的: Wan 2.1 Fun Control モデルを用いた動画生成に必要な条件付け情報(conditioning information)を準備すること。
入力
| パラメーター名 | 必須 | データ型 | 説明 | デフォルト値 |
|---|---|---|---|---|
| positive | はい | CONDITIONING | 標準的な ComfyUI の正の条件付けデータで、通常は「CLIP Text Encode」ノードから取得されます。正のプロンプトは、ユーザーが生成動画に求める内容、主題、および芸術的スタイルを記述します。 | N/A |
| negative | はい | CONDITIONING | 標準的な ComfyUI の負の条件付けデータで、通常は「CLIP Text Encode」ノードによって生成されます。負のプロンプトは、ユーザーが生成動画から除外したい要素、スタイル、またはアーティファクトを指定します。 | N/A |
| vae | はい | VAE | Wan 2.1 Fun モデルシリーズと互換性のある VAE(変分自己符号化器)モデルが必要です。画像/動画データの符号化および復号化に使用されます。 | N/A |
| width | はい | INT | 出力動画フレームの幅(ピクセル単位)。デフォルト値は 832、最小値は 16、最大値は nodes.MAX_RESOLUTION で定義され、ステップサイズは 16 です。 | 832 |
| height | はい | INT | 出力動画フレームの高さ(ピクセル単位)。デフォルト値は 480、最小値は 16、最大値は nodes.MAX_RESOLUTION で定義され、ステップサイズは 16 です。 | 480 |
| length | はい | INT | 生成動画の総フレーム数。デフォルト値は 81、最小値は 1、最大値は nodes.MAX_RESOLUTION で定義され、ステップサイズは 4 です。 | 81 |
| batch_size | はい | INT | 一度に生成される動画の数。デフォルト値は 1、最小値は 1、最大値は 4096 です。 | 1 |
| clip_vision_output | いいえ | CLIP_VISION_OUTPUT | (任意)CLIP 視覚モデルによって抽出された視覚的特徴。視覚的スタイルおよびコンテンツのガイドとして利用可能です。 | None |
| start_image | いいえ | IMAGE | (任意)生成動画の開始部分に影響を与える初期画像。 | None |
| control_video | いいえ | IMAGE | (任意)事前処理済みの ControlNet 参照動画を提供し、生成動画の動きおよび潜在的な構造をガイドできます。 | None |
出力
| パラメーター名 | データ型 | 説明 |
|---|---|---|
| positive | CONDITIONING | エンコード済みの start_image および control_video を含む、強化された正の条件付けデータを提供します。 |
| negative | CONDITIONING | 同様に強化された負の条件付けデータを提供します。これには、同じ concat_latent_image が含まれます。 |
| latent | LATENT | キー "samples" を持つ空の潜在テンソルを含む辞書です。 |