HunyuanVideo15ImageToVideo - ComfyUI Built-in Node Documentation

HunyuanVideo15ImageToVideo 노드는 HunyuanVideo 1.5 모델을 기반으로 비디오 생성을 위한 컨디셔닝 및 잠재 공간 데이터를 준비합니다. 비디오 시퀀스의 초기 잠재 표현을 생성하며, 선택적으로 시작 이미지나 CLIP 비전 출력을 통합하여 생성 과정을 안내할 수 있습니다.

입력

매개변수	설명	데이터 타입	필수 여부	범위
`positive`	비디오에 포함되어야 할 내용을 설명하는 긍정 컨디셔닝 프롬프트입니다.	CONDITIONING	예	-
`negative`	비디오에서 제외되어야 할 내용을 설명하는 부정 컨디셔닝 프롬프트입니다.	CONDITIONING	예	-
`vae`	시작 이미지를 잠재 공간으로 인코딩하는 데 사용되는 VAE(변분 오토인코더) 모델입니다.	VAE	예	-
`width`	출력 비디오 프레임의 가로 너비(픽셀 단위)입니다. 16으로 나누어 떨어져야 합니다. (기본값: 848)	INT	아니요	16 ~ MAX_RESOLUTION
`height`	출력 비디오 프레임의 세로 높이(픽셀 단위)입니다. 16으로 나누어 떨어져야 합니다. (기본값: 480)	INT	아니요	16 ~ MAX_RESOLUTION
`length`	비디오 시퀀스의 총 프레임 수입니다. 4의 배수여야 합니다. (기본값: 33)	INT	아니요	1 ~ MAX_RESOLUTION
`batch_size`	단일 배치에서 생성할 비디오 시퀀스의 개수입니다. (기본값: 1)	INT	아니요	1 ~ 4096
`start_image`	비디오 생성을 초기화하는 선택적 시작 이미지입니다. 제공되면 인코딩되어 첫 번째 프레임의 컨디셔닝에 사용됩니다. 이미지의 첫 `length` 프레임만 사용됩니다.	IMAGE	아니요	-
`clip_vision_output`	생성 과정에 추가적인 시각적 컨디셔닝을 제공하는 선택적 CLIP 비전 임베딩입니다.	CLIP_VISION_OUTPUT	아니요	-

참고: start_image가 제공되면 이중 선형 보간법을 사용하여 지정된 width 및 height에 맞게 자동으로 크기가 조정됩니다. 이미지 배치의 첫 length 프레임이 사용됩니다. 그런 다음 인코딩된 이미지는 해당 concat_mask와 함께 concat_latent_image로 positive 및 negative 컨디셔닝에 모두 추가됩니다. 마스크는 시작 이미지가 포함된 프레임에 대해 0.0으로 설정되고 나머지 프레임에 대해 1.0으로 설정됩니다.

출력

출력 이름	설명	데이터 타입
`positive`	수정된 긍정 컨디셔닝으로, 이제 인코딩된 시작 이미지 또는 CLIP 비전 출력이 포함될 수 있습니다.	CONDITIONING
`negative`	수정된 부정 컨디셔닝으로, 이제 인코딩된 시작 이미지 또는 CLIP 비전 출력이 포함될 수 있습니다.	CONDITIONING
`latent`	지정된 배치 크기, 비디오 길이, 너비 및 높이에 맞게 차원이 구성된 빈 잠재 텐서입니다.	LATENT

이 문서는 AI에 의해 생성되었습니다. 오류를 발견하거나 개선 제안이 있으시면 기여해 주세요! GitHub에서 편집

Source fingerprint (SHA-256): 2f41bbb080672683fb1755be575f08c79ca03e324df66953eb40631581197d47

​입력

​출력

입력

출력