입력
| 매개변수 | 설명 | 데이터 타입 | 필수 | 범위 |
|---|---|---|---|---|
positive | 인페인팅 잠재 정보로 보강할 포지티브 컨디셔닝 | CONDITIONING | 예 | - |
negative | 인페인팅 잠재 정보로 보강할 네거티브 컨디셔닝 | CONDITIONING | 예 | - |
vae | 마스크와 마스킹된 비디오를 잠재 공간으로 인코딩하는 데 사용되는 VAE 모델 | VAE | 예 | - |
video | 소스 비디오 프레임 [T, H, W, 3] | IMAGE | 예 | - |
quadmask | VOIDQuadmaskPreprocess에서 전처리된 쿼드마스크 [T, H, W] | MASK | 예 | - |
width | 비디오와 마스크를 리사이즈할 너비 (기본값: 672) | INT | 예 | 16 ~ MAX_RESOLUTION (단위: 8) |
height | 비디오와 마스크를 리사이즈할 높이 (기본값: 384) | INT | 예 | 16 ~ MAX_RESOLUTION (단위: 8) |
length | 처리할 픽셀 프레임 수. CogVideoX-Fun-V1.5(patch_size_t=2)의 경우 latent_t가 짝수여야 하므로, 홀수 latent_t를 생성하는 길이는 내림 처리됩니다(예: 49 → 45) (기본값: 45) | INT | 예 | 1 ~ MAX_RESOLUTION (단위: 1) |
batch_size | 출력 노이즈 잠재의 배치 크기 (기본값: 1) | INT | 예 | 1 ~ 64 |
출력
| 출력 이름 | 설명 | 데이터 타입 |
|---|---|---|
negative | 인페인팅 잠재 정보가 추가된 포지티브 컨디셔닝 | CONDITIONING |
latent | 인페인팅 잠재 정보가 추가된 네거티브 컨디셔닝 | CONDITIONING |
latent | 형태가 [batch_size, 16, latent_t, latent_h, latent_w]인 0으로 채워진 노이즈 잠재 텐서 | LATENT |
이 문서는 AI에 의해 생성되었습니다. 오류를 발견하거나 개선 제안이 있으시면 기여해 주세요! GitHub에서 편집
Source fingerprint (SHA-256):
a1fe36376d7930286c7a288f261dcf2961d6b13cc412d1a0d42af8a4f9ebeeaf