Wan22ImageToVideoLatent - ComfyUI Built-in Node Documentation

Wan22ImageToVideoLatent 노드는 이미지로부터 비디오 잠재 표현을 생성합니다. 지정된 차원으로 빈 비디오 잠재 공간을 생성하고, 선택적으로 시작 이미지 시퀀스를 첫 번째 프레임에 인코딩할 수 있습니다. 시작 이미지가 제공되면 이미지를 잠재 공간으로 인코딩하고 인페인팅된 영역에 대한 해당 노이즈 마스크를 생성합니다.

입력

매개변수	설명	데이터 타입	필수	범위
`VAE`	이미지를 잠재 공간으로 인코딩하는 데 사용되는 VAE 모델	VAE	예	-
`너비`	출력 비디오의 픽셀 단위 너비 (기본값: 1280, 단계: 32)	INT	예	32 ~ MAX_RESOLUTION
`높이`	출력 비디오의 픽셀 단위 높이 (기본값: 704, 단계: 32)	INT	예	32 ~ MAX_RESOLUTION
`길이`	비디오 시퀀스의 프레임 수 (기본값: 49, 단계: 4)	INT	예	1 ~ MAX_RESOLUTION
`배치 크기`	생성할 배치 수 (기본값: 1)	INT	예	1 ~ 4096
`시작 이미지`	비디오 잠재 표현에 인코딩할 선택적 시작 이미지 시퀀스	IMAGE	아니요	-

참고: start_image가 제공되면 노드는 이미지 시퀀스를 잠재 공간의 시작 프레임으로 인코딩하고 해당 노이즈 마스크를 생성합니다. width 및 height 매개변수는 적절한 잠재 공간 차원을 위해 16으로 나누어져야 합니다. length 매개변수는 비디오 잠재 표현의 프레임 수를 결정하며, 잠재 공간의 시간적 차원은 ((length - 1) // 4) + 1로 계산됩니다.

출력

출력 이름	설명	데이터 타입
`samples`	생성된 비디오 잠재 표현	LATENT
`noise_mask`	생성 중 노이즈 제거가 필요한 영역을 나타내는 노이즈 마스크	LATENT

이 문서는 AI에 의해 생성되었습니다. 오류를 발견하거나 개선 제안이 있으시면 기여해 주세요! GitHub에서 편집

Source fingerprint (SHA-256): 0f27e20bcc63f0dd224cda0fa26ee676c42898ac74fcfbe0a2b591def933689c

​입력

​출력

입력

출력