メインコンテンツへスキップ
このドキュメントは AI によって生成されました。誤りを発見された場合、または改善に関するご提案がある場合は、ぜひご貢献ください!GitHub で編集する
WanSoundImageToVideoExtend ノードは、音声条件付け(audio conditioning)と参照画像を取り入れることで、画像から動画を生成する機能を拡張します。このノードは、正の条件付け(positive conditioning)および負の条件付け(negative conditioning)、動画の潜在表現(video latent data)、および任意の音声埋め込み(audio embeddings)を受け取り、拡張された動画シーケンスを生成します。ノードはこれらの入力を処理し、音声のヒント(audio cues)と同期した一貫性のある動画出力を生成します。

入力

パラメーターデータ型必須範囲説明
positiveCONDITIONINGはい-動画に含めるべき内容を指示する正の条件付けプロンプト
negativeCONDITIONINGはい-動画から除外すべき内容を指定する負の条件付けプロンプト
vaeVAEはい-動画フレームの符号化および復号化に使用される変分自己符号化器(Variational Autoencoder)
lengthINTはい1 ~ MAX_RESOLUTION動画シーケンスに対して生成するフレーム数(デフォルト値:77、ステップ:4)
video_latentLATENTはい-拡張の起点となる初期の動画潜在表現
audio_encoder_outputAUDIOENCODEROUTPUTいいえ-音声の特徴に基づいて動画生成に影響を与えることのできる任意の音声埋め込み
ref_imageIMAGEいいえ-動画生成に視覚的なガイドを提供する任意の参照画像
control_videoIMAGEいいえ-生成される動画の動きやスタイルを制御するための任意の制御動画

出力

出力名データ型説明
positiveCONDITIONING動画コンテキストが適用された処理済みの正の条件付け
negativeCONDITIONING動画コンテキストが適用された処理済みの負の条件付け
latentLATENT拡張された動画シーケンスを含む生成された動画潜在表現