HunyuanVideo15ImageToVideo
HunyuanVideo15ImageToVideo 노드는 HunyuanVideo 1.5 모델을 기반으로 비디오 생성을 위한 컨디셔닝 및 잠재 공간 데이터를 준비합니다. 비디오 시퀀스의 초기 잠재 표현을 생성하며, 선택적으로 시작 이미지나 CLIP 비전 출력을 통합하여 생성 과정을 안내할 수 있습니다.입력
| 매개변수 | 설명 | 데이터 타입 | 필수 여부 | 범위 |
|---|---|---|---|---|
positive | 비디오에 포함되어야 할 내용을 설명하는 긍정 컨디셔닝 프롬프트입니다. | CONDITIONING | 예 | - |
negative | 비디오에서 제외되어야 할 내용을 설명하는 부정 컨디셔닝 프롬프트입니다. | CONDITIONING | 예 | - |
vae | 시작 이미지를 잠재 공간으로 인코딩하는 데 사용되는 VAE(변분 오토인코더) 모델입니다. | VAE | 예 | - |
width | 출력 비디오 프레임의 가로 너비(픽셀 단위)입니다. 16으로 나누어 떨어져야 합니다. (기본값: 848) | INT | 아니요 | 16 ~ MAX_RESOLUTION |
height | 출력 비디오 프레임의 세로 높이(픽셀 단위)입니다. 16으로 나누어 떨어져야 합니다. (기본값: 480) | INT | 아니요 | 16 ~ MAX_RESOLUTION |
length | 비디오 시퀀스의 총 프레임 수입니다. 4의 배수여야 합니다. (기본값: 33) | INT | 아니요 | 1 ~ MAX_RESOLUTION |
batch_size | 단일 배치에서 생성할 비디오 시퀀스의 개수입니다. (기본값: 1) | INT | 아니요 | 1 ~ 4096 |
start_image | 비디오 생성을 초기화하는 선택적 시작 이미지입니다. 제공되면 인코딩되어 첫 번째 프레임의 컨디셔닝에 사용됩니다. 이미지의 첫 length 프레임만 사용됩니다. | IMAGE | 아니요 | - |
clip_vision_output | 생성 과정에 추가적인 시각적 컨디셔닝을 제공하는 선택적 CLIP 비전 임베딩입니다. | CLIP_VISION_OUTPUT | 아니요 | - |
start_image가 제공되면 이중 선형 보간법을 사용하여 지정된 width 및 height에 맞게 자동으로 크기가 조정됩니다. 이미지 배치의 첫 length 프레임이 사용됩니다. 그런 다음 인코딩된 이미지는 해당 concat_mask와 함께 concat_latent_image로 positive 및 negative 컨디셔닝에 모두 추가됩니다. 마스크는 시작 이미지가 포함된 프레임에 대해 0.0으로 설정되고 나머지 프레임에 대해 1.0으로 설정됩니다.
출력
| 출력 이름 | 설명 | 데이터 타입 |
|---|---|---|
negative | 수정된 긍정 컨디셔닝으로, 이제 인코딩된 시작 이미지 또는 CLIP 비전 출력이 포함될 수 있습니다. | CONDITIONING |
latent | 수정된 부정 컨디셔닝으로, 이제 인코딩된 시작 이미지 또는 CLIP 비전 출력이 포함될 수 있습니다. | CONDITIONING |
latent | 지정된 배치 크기, 비디오 길이, 너비 및 높이에 맞게 차원이 구성된 빈 잠재 텐서입니다. | LATENT |
이 문서는 AI에 의해 생성되었습니다. 오류를 발견하거나 개선 제안이 있으시면 기여해 주세요! GitHub에서 편집
Source fingerprint (SHA-256):
2f41bbb080672683fb1755be575f08c79ca03e324df66953eb40631581197d47