메인 콘텐츠로 건너뛰기
LTXVConcatAVLatent 노드는 비디오 잠재 표현과 오디오 잠재 표현을 하나의 결합된 잠재 출력으로 결합합니다. 두 입력의 samples 텐서를 병합하고, noise_mask 텐서가 있는 경우 함께 병합하여 비디오 생성 파이프라인에서 추가 처리를 준비합니다.

입력

매개변수설명데이터 타입필수범위
video_latent비디오 데이터의 잠재 표현입니다.LATENT
audio_latent오디오 데이터의 잠재 표현입니다.LATENT
참고: video_latentaudio_latent 입력의 samples 텐서는 연결됩니다. 입력 중 하나에 noise_mask가 포함된 경우 해당 마스크가 사용되며, 하나가 누락된 경우 해당 samples와 동일한 형태의 1로 구성된 마스크가 생성됩니다. 그런 다음 결과 마스크도 연결됩니다.

출력

출력 이름설명데이터 타입
latent비디오 및 오디오 입력에서 연결된 samples와, 해당하는 경우 연결된 noise_mask를 포함하는 단일 잠재 딕셔너리입니다.LATENT
이 문서는 AI에 의해 생성되었습니다. 오류를 발견하거나 개선 제안이 있으시면 기여해 주세요! GitHub에서 편집

Source fingerprint (SHA-256): 322d6870f110fb1ef8b472cb49649cc9fff7865f4c7a83fbfd536f1fdfd694f8