메인 콘텐츠로 건너뛰기
TextEncodeHunyuanVideo_ImageToVideo 노드는 텍스트 프롬프트와 이미지 임베딩을 결합하여 비디오 생성을 위한 컨디셔닝 데이터를 생성합니다. CLIP 모델을 사용하여 텍스트 입력과 CLIP 비전 출력의 시각적 정보를 모두 처리한 후, 지정된 이미지 인터리브 설정에 따라 이 두 소스를 혼합한 토큰을 생성합니다.

입력

매개변수설명데이터 타입필수범위
클립토큰화 및 인코딩에 사용되는 CLIP 모델CLIP-
clip_vision 출력이미지 컨텍스트를 제공하는 CLIP 비전 모델의 시각적 임베딩CLIP_VISION_OUTPUT-
프롬프트비디오 생성을 안내하는 텍스트 설명으로, 여러 줄 입력 및 동적 프롬프트를 지원합니다STRING-
이미지 인터리브텍스트 프롬프트 대비 이미지가 결과에 미치는 영향도를 조절합니다. 값이 높을수록 텍스트 프롬프트의 영향력이 커집니다. (기본값: 2)INT1-512

출력

출력 이름설명데이터 타입
CONDITIONING비디오 생성을 위해 텍스트와 이미지 정보를 결합한 컨디셔닝 데이터CONDITIONING
이 문서는 AI에 의해 생성되었습니다. 오류를 발견하거나 개선 제안이 있으시면 기여해 주세요! GitHub에서 편집

Source fingerprint (SHA-256): ee748bd1fb1733593eb4cb1187c5cc279171163cfbc389f039378d0e366fc231