メインコンテンツへスキップ
WanSoundImageToVideo ノードは、オプションのオーディオ条件付けを伴う画像から動画コンテンツを生成します。ポジティブおよびネガティブの条件付けプロンプトとVAEモデルを入力として受け取り、動画の潜在表現を生成します。また、参照画像、オーディオエンコーディング、制御動画、モーション参照を組み込むことで、動画生成プロセスを誘導することができます。

入力

パラメータ説明データ型必須範囲
ポジティブ生成される動画に表示されるべきコンテンツを誘導するポジティブ条件付けプロンプトCONDITIONINGはい-
ネガティブ生成される動画で避けるべきコンテンツを指定するネガティブ条件付けプロンプトCONDITIONINGはい-
VAE動画の潜在表現のエンコードとデコードに使用されるVAEモデルVAEはい-
出力動画の幅(ピクセル単位、デフォルト: 832、16で割り切れる必要があります)INTはい16 ~ MAX_RESOLUTION
高さ出力動画の高さ(ピクセル単位、デフォルト: 480、16で割り切れる必要があります)INTはい16 ~ MAX_RESOLUTION
長さ生成される動画のフレーム数(デフォルト: 77、4で割り切れる必要があります)INTはい1 ~ MAX_RESOLUTION
バッチサイズ同時に生成する動画の数(デフォルト: 1)INTはい1 ~ 4096
オーディオエンコーダ出力音響特性に基づいて動画生成に影響を与えることができるオプションのオーディオエンコーディングAUDIOENCODEROUTPUTいいえ-
参照画像動画コンテンツに視覚的なガイダンスを提供するオプションの参照画像IMAGEいいえ-
制御ビデオ生成される動画の動きと構造を誘導するオプションの制御動画IMAGEいいえ-
参照モーション動画内の動きパターンに対するガイダンスを提供するオプションのモーション参照IMAGEいいえ-

出力

出力名説明データ型
ネガティブ動画生成用に変更された処理済みのポジティブ条件付けCONDITIONING
潜在表現動画生成用に変更された処理済みのネガティブ条件付けCONDITIONING
latent最終的な動画フレームにデコード可能な、潜在空間で表現された生成動画LATENT
このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください! GitHub で編集

Source fingerprint (SHA-256): f80f82b8671294a14ecfecf91bc13febae0c91c5efa438467a4413d52dc82d3f