메인 콘텐츠로 건너뛰기
WanDancerVideo 노드는 WanDancer 모델을 사용한 비디오 생성에 필요한 조건화 데이터와 빈 잠재 텐서를 준비합니다. 시작 이미지, 마스크, CLIP 비전 임베딩 및 오디오 특징과 같은 선택적 입력과 함께 긍정 및 부정 조건화를 결합하여 생성된 비디오를 제어합니다.

입력

매개변수설명데이터 타입필수 여부범위
positive비디오 생성을 안내하는 긍정 조건화입니다.CONDITIONING
negative비디오 생성을 안내하는 부정 조건화입니다.CONDITIONING
vae시작 이미지를 잠재 공간으로 인코딩하는 데 사용되는 VAE입니다.VAE
너비생성된 비디오의 픽셀 단위 너비입니다 (기본값: 480).INT16 ~ MAX_RESOLUTION (단위: 16)
높이생성된 비디오의 픽셀 단위 높이입니다 (기본값: 832).INT16 ~ MAX_RESOLUTION (단위: 16)
길이생성된 비디오의 프레임 수입니다. WanDancer의 경우 149로 유지해야 합니다 (기본값: 149).INT1 ~ MAX_RESOLUTION (단위: 4)
clip_vision_output첫 번째 프레임에 대한 CLIP 비전 임베딩입니다.CLIP_VISION_OUTPUT아니요
clip_vision_output_ref참조 이미지에 대한 CLIP 비전 임베딩입니다.CLIP_VISION_OUTPUT아니요
시작 이미지인코딩할 초기 이미지입니다. 지정된 길이까지 여러 프레임이 될 수 있습니다.IMAGE아니요
마스크시작 이미지에 대한 이미지 조건화 마스크입니다. 흰색 영역은 유지되고 검은색 영역은 생성됩니다. 로컬 생성에 사용됩니다.MASK아니요
audio_encoder_output오디오 인코더의 출력으로, 오디오 조건화 생성을 위한 오디오 특징, fps 및 주입 비율을 제공합니다.AUDIO_ENCODER_OUTPUT아니요
매개변수 제약 조건 참고:
  • start_imagemask 입력은 선택 사항이지만 함께 사용할 수 있습니다. start_image가 제공되면 인코딩되어 잠재 텐서와 연결됩니다. mask도 제공되면 시작 이미지 중 유지할 부분(흰색)과 재생성할 부분(검은색)을 제어합니다. mask가 제공되지 않으면 전체 시작 이미지 영역이 조건화 안내로 사용됩니다.
  • clip_vision_outputclip_vision_output_ref 입력은 선택 사항이며, 첫 번째 프레임과 참조 이미지에 대한 시각적 컨텍스트를 제공하기 위해 함께 사용할 수 있습니다.
  • audio_encoder_output 입력은 선택 사항이며, 오디오 조건화 생성을 위한 오디오 특징을 제공합니다.

출력

출력 이름설명데이터 타입
negative추가 데이터(연결된 잠재 텐서, CLIP 비전, 오디오)가 첨부된 긍정 조건화입니다.CONDITIONING
latent추가 데이터(연결된 잠재 텐서, CLIP 비전, 오디오)가 첨부된 부정 조건화입니다.CONDITIONING
latent지정된 비디오 길이, 높이 및 너비와 일치하는 차원의 빈 잠재 텐서입니다.LATENT
이 문서는 AI에 의해 생성되었습니다. 오류를 발견하거나 개선 제안이 있으시면 기여해 주세요! GitHub에서 편집

Source fingerprint (SHA-256): 7ab1b4662eb8d780295ea3a3e3139c64d81e03a979a293a481f82deaf1fc2f7e