입력
| 매개변수 | 설명 | 데이터 타입 | 필수 여부 | 범위 |
|---|---|---|---|---|
av_latent | 분할할 결합된 오디오-비디오 잠재 표현입니다. | LATENT | 예 | 해당 없음 |
samples 텐서는 첫 번째 차원(배치 차원)을 따라 최소 두 개의 요소를 가질 것으로 예상됩니다. 첫 번째 요소는 비디오 잠재 표현에 사용되고, 두 번째 요소는 오디오 잠재 표현에 사용됩니다. noise_mask가 있는 경우 동일한 방식으로 분할됩니다.
출력
| 출력 이름 | 설명 | 데이터 타입 |
|---|---|---|
audio_latent | 분할된 비디오 데이터를 포함하는 잠재 표현입니다. | LATENT |
audio_latent | 분할된 오디오 데이터를 포함하는 잠재 표현입니다. | LATENT |
이 문서는 AI에 의해 생성되었습니다. 오류를 발견하거나 개선 제안이 있으시면 기여해 주세요! GitHub에서 편집
Source fingerprint (SHA-256):
55bce5d768e7fe13f885cc32d34ecdac5cdcbb667b03743004866ea4b6d58d46