메인 콘텐츠로 건너뛰기
VOIDInpaintConditioning 노드는 CogVideoX 모델의 인페인팅에 필요한 컨디셔닝 데이터를 준비합니다. 소스 비디오와 전처리된 쿼드마스크를 입력받아 VAE를 통해 인코딩한 후, 모델이 마스크 영역을 채우는 데 사용하는 32채널 컨디셔닝 신호로 결합합니다.

입력

매개변수설명데이터 타입필수범위
positive인페인팅 잠재 정보로 보강할 포지티브 컨디셔닝CONDITIONING-
negative인페인팅 잠재 정보로 보강할 네거티브 컨디셔닝CONDITIONING-
vae마스크와 마스킹된 비디오를 잠재 공간으로 인코딩하는 데 사용되는 VAE 모델VAE-
video소스 비디오 프레임 [T, H, W, 3]IMAGE-
quadmaskVOIDQuadmaskPreprocess에서 전처리된 쿼드마스크 [T, H, W]MASK-
width비디오와 마스크를 리사이즈할 너비 (기본값: 672)INT16 ~ MAX_RESOLUTION (단위: 8)
height비디오와 마스크를 리사이즈할 높이 (기본값: 384)INT16 ~ MAX_RESOLUTION (단위: 8)
length처리할 픽셀 프레임 수. CogVideoX-Fun-V1.5(patch_size_t=2)의 경우 latent_t가 짝수여야 하므로, 홀수 latent_t를 생성하는 길이는 내림 처리됩니다(예: 49 → 45) (기본값: 45)INT1 ~ MAX_RESOLUTION (단위: 1)
batch_size출력 노이즈 잠재의 배치 크기 (기본값: 1)INT1 ~ 64

출력

출력 이름설명데이터 타입
negative인페인팅 잠재 정보가 추가된 포지티브 컨디셔닝CONDITIONING
latent인페인팅 잠재 정보가 추가된 네거티브 컨디셔닝CONDITIONING
latent형태가 [batch_size, 16, latent_t, latent_h, latent_w]인 0으로 채워진 노이즈 잠재 텐서LATENT
이 문서는 AI에 의해 생성되었습니다. 오류를 발견하거나 개선 제안이 있으시면 기여해 주세요! GitHub에서 편집

Source fingerprint (SHA-256): a1fe36376d7930286c7a288f261dcf2961d6b13cc412d1a0d42af8a4f9ebeeaf