メインコンテンツへスキップ
このドキュメンテーションは AI によって生成されました。誤りを発見された場合、または改善に関するご提案がある場合は、ぜひご貢献ください! GitHub で編集する
WanSoundImageToVideo ノードは、画像から動画コンテンツを生成するノードであり、オプションで音声による条件付けをサポートします。このノードは、正の条件付けプロンプトと負の条件付けプロンプト、および VAE モデルを用いて動画の潜在表現(latent)を生成します。さらに、参照画像、音声エンコーディング、制御用動画、運動参照などの要素を取り入れることで、動画生成プロセスをより精密に制御できます。

入力

パラメーターデータ型必須範囲説明
positiveCONDITIONINGはい-生成される動画に含まれるべきコンテンツを指示する正の条件付けプロンプト
negativeCONDITIONINGはい-生成される動画に含まれてはならないコンテンツを指定する負の条件付けプロンプト
vaeVAEはい-動画の潜在表現の符号化および復号化に使用される VAE モデル
widthINTはい16 ~ MAX_RESOLUTION出力動画の幅(ピクセル単位)。デフォルト値:832。16 の倍数である必要があります。
heightINTはい16 ~ MAX_RESOLUTION出力動画の高さ(ピクセル単位)。デフォルト値:480。16 の倍数である必要があります。
lengthINTはい1 ~ MAX_RESOLUTION生成される動画のフレーム数。デフォルト値:77。4 の倍数である必要があります。
batch_sizeINTはい1 ~ 4096同時に生成する動画の数。デフォルト値:1
audio_encoder_outputAUDIOENCODEROUTPUTいいえ-オプションの音声エンコーディング。音声の特徴に基づいて動画生成に影響を与えます。
ref_imageIMAGEいいえ-オプションの参照画像。動画コンテンツに対して視覚的なガイドを提供します。
control_videoIMAGEいいえ-オプションの制御用動画。生成される動画の動きや構造をガイドします。
ref_motionIMAGEいいえ-オプションの運動参照。動画内の動きのパターンをガイドします。

出力

出力名データ型説明
positiveCONDITIONING動画生成向けに処理・調整された正の条件付けプロンプト
negativeCONDITIONING動画生成向けに処理・調整された負の条件付けプロンプト
latentLATENT潜在空間における生成動画の表現。最終的な動画フレームへと復号化可能です。