メインコンテンツへスキップ
VOIDInpaintConditioning ノードは、CogVideoX モデルでインペインティングを行うために必要な条件付けデータを準備します。ソース動画と前処理済みのクワッドマスクを受け取り、VAE を通じてエンコードし、それらを 32 チャンネルの条件付け信号に結合します。この信号は、モデルがマスク領域を補完するために使用します。

入力

パラメータ説明データ型必須範囲
positiveインペインティング潜在情報で拡張されるポジティブ条件付けCONDITIONINGはい-
negativeインペインティング潜在情報で拡張されるネガティブ条件付けCONDITIONINGはい-
vaeマスクとマスク済み動画を潜在空間にエンコードするために使用する VAE モデルVAEはい-
videoソース動画フレーム [T, H, W, 3]IMAGEはい-
quadmaskVOIDQuadmaskPreprocess からの前処理済みクワッドマスク [T, H, W]MASKはい-
width動画とマスクのリサイズ幅(デフォルト: 672)INTはい16 ~ MAX_RESOLUTION(ステップ: 8)
height動画とマスクのリサイズ高さ(デフォルト: 384)INTはい16 ~ MAX_RESOLUTION(ステップ: 8)
length処理するピクセルフレーム数。CogVideoX-Fun-V1.5(patch_size_t=2)の場合、latent_t は偶数である必要があります。奇数になる長さは切り捨てられます(例: 49 → 45)(デフォルト: 45)INTはい1 ~ MAX_RESOLUTION(ステップ: 1)
batch_size出力ノイズ潜在のバッチサイズ(デフォルト: 1)INTはい1 ~ 64

出力

出力名説明データ型
negativeインペインティング潜在情報が追加されたポジティブ条件付けCONDITIONING
latentインペインティング潜在情報が追加されたネガティブ条件付けCONDITIONING
latent形状 [batch_size, 16, latent_t, latent_h, latent_w] のゼロ埋めノイズ潜在テンソルLATENT
このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください! GitHub で編集

Source fingerprint (SHA-256): a1fe36376d7930286c7a288f261dcf2961d6b13cc412d1a0d42af8a4f9ebeeaf