Wan22ImageToVideoLatent 노드
Wan22ImageToVideoLatent 노드는 이미지로부터 비디오 잠재 표현을 생성합니다. 지정된 차원으로 빈 비디오 잠재 공간을 생성하고, 선택적으로 시작 이미지 시퀀스를 첫 번째 프레임에 인코딩할 수 있습니다. 시작 이미지가 제공되면 이미지를 잠재 공간으로 인코딩하고 인페인팅된 영역에 대한 해당 노이즈 마스크를 생성합니다.입력
| 매개변수 | 설명 | 데이터 타입 | 필수 | 범위 |
|---|---|---|---|---|
VAE | 이미지를 잠재 공간으로 인코딩하는 데 사용되는 VAE 모델 | VAE | 예 | - |
너비 | 출력 비디오의 픽셀 단위 너비 (기본값: 1280, 단계: 32) | INT | 예 | 32 ~ MAX_RESOLUTION |
높이 | 출력 비디오의 픽셀 단위 높이 (기본값: 704, 단계: 32) | INT | 예 | 32 ~ MAX_RESOLUTION |
길이 | 비디오 시퀀스의 프레임 수 (기본값: 49, 단계: 4) | INT | 예 | 1 ~ MAX_RESOLUTION |
배치 크기 | 생성할 배치 수 (기본값: 1) | INT | 예 | 1 ~ 4096 |
시작 이미지 | 비디오 잠재 표현에 인코딩할 선택적 시작 이미지 시퀀스 | IMAGE | 아니요 | - |
start_image가 제공되면 노드는 이미지 시퀀스를 잠재 공간의 시작 프레임으로 인코딩하고 해당 노이즈 마스크를 생성합니다. width 및 height 매개변수는 적절한 잠재 공간 차원을 위해 16으로 나누어져야 합니다. length 매개변수는 비디오 잠재 표현의 프레임 수를 결정하며, 잠재 공간의 시간적 차원은 ((length - 1) // 4) + 1로 계산됩니다.
출력
| 출력 이름 | 설명 | 데이터 타입 |
|---|---|---|
samples | 생성된 비디오 잠재 표현 | LATENT |
noise_mask | 생성 중 노이즈 제거가 필요한 영역을 나타내는 노이즈 마스크 | LATENT |
이 문서는 AI에 의해 생성되었습니다. 오류를 발견하거나 개선 제안이 있으시면 기여해 주세요! GitHub에서 편집
Source fingerprint (SHA-256):
0f27e20bcc63f0dd224cda0fa26ee676c42898ac74fcfbe0a2b591def933689c