メインコンテンツへスキップ
このドキュメントは AI によって生成されました。誤りを発見された場合、または改善のご提案がある場合は、ぜひご貢献ください! GitHub で編集する
WanHuMoImageToVideo ノードは、動画フレームの潜在表現(latent representation)を生成することにより、画像を動画シーケンスに変換します。このノードは条件付け入力(conditioning input)を処理し、参照画像および音声埋め込み(audio embedding)を組み込むことで、動画生成に影響を与えます。ノードは、動画合成に適した修正済みの条件付けデータおよび潜在表現を出力します。

入力

パラメーターデータ型必須範囲説明
positiveCONDITIONINGはい-動画生成を望ましいコンテンツへと導く正の条件付け入力
negativeCONDITIONINGはい-動画生成を不要なコンテンツから遠ざける負の条件付け入力
vaeVAEはい-参照画像を潜在空間にエンコードするために使用される VAE モデル
widthINTはい16 ~ MAX_RESOLUTION出力動画フレームの幅(ピクセル単位)。デフォルト値:832(16 で割り切れる必要があります)
heightINTはい16 ~ MAX_RESOLUTION出力動画フレームの高さ(ピクセル単位)。デフォルト値:480(16 で割り切れる必要があります)
lengthINTはい1 ~ MAX_RESOLUTION生成される動画シーケンスのフレーム数。デフォルト値:97
batch_sizeINTはい1 ~ 4096同時に生成する動画シーケンスの数。デフォルト値:1
audio_encoder_outputAUDIOENCODEROUTPUTいいえ-オプションの音声エンコーディングデータ。音声コンテンツに基づいて動画生成に影響を与えることができます
ref_imageIMAGEいいえ-オプションの参照画像。動画生成のスタイルおよびコンテンツを制御するために使用されます
注意: 参照画像が指定された場合、その画像はエンコードされ、正および負の条件付けの両方に追加されます。また、音声エンコーダー出力が指定された場合、そのデータは処理されて条件付けデータに統合されます。

出力

出力名データ型説明
positiveCONDITIONING参照画像および/または音声埋め込みを含む、修正済みの正の条件付け
negativeCONDITIONING参照画像および/または音声埋め込みを含む、修正済みの負の条件付け
latentLATENT動画シーケンスのデータを含む生成された潜在表現