Kling 립싱크 오디오-투-비디오 노드
Kling 립싱크 오디오-투-비디오 노드는 비디오 파일의 입 움직임을 오디오 파일의 음성 내용과 동기화합니다. 이 노드는 오디오의 음성 패턴을 분석하고 비디오의 얼굴 움직임을 조정하여 사실적인 립싱크를 생성합니다. 이 과정에는 뚜렷한 얼굴이 포함된 비디오와 명확하게 구분되는 음성이 포함된 오디오 파일이 모두 필요합니다.입력
| 매개변수 | 설명 | 데이터 타입 | 필수 | 범위 |
|---|---|---|---|---|
비디오 | 립싱크할 얼굴이 포함된 비디오 파일 | VIDEO | 예 | - |
오디오 | 비디오와 동기화할 음성이 포함된 오디오 파일 | AUDIO | 예 | - |
음성 언어 | 오디오 파일에 포함된 음성의 언어 (기본값: “en”) | COMBO | 예 | "en""zh""es""fr""de""it""pt""pl""tr""ru""nl""cs""ar""ja""hu""ko" |
- 오디오 파일은 5MB를 초과할 수 없습니다
- 비디오 파일은 100MB를 초과할 수 없습니다
- 비디오의 가로/세로 크기는 720px에서 1920px 사이여야 합니다
- 비디오 길이는 2초에서 10초 사이여야 합니다
- 오디오에는 명확하게 구분되는 음성이 포함되어야 합니다
- 비디오에는 뚜렷한 얼굴이 포함되어야 합니다
출력
| 출력 이름 | 설명 | 데이터 타입 |
|---|---|---|
비디오 ID | 립싱크된 입 움직임이 적용된 처리된 비디오 | VIDEO |
재생 시간 | 처리된 비디오의 고유 식별자 | STRING |
duration | 처리된 비디오의 길이 | STRING |
이 문서는 AI에 의해 생성되었습니다. 오류를 발견하거나 개선 제안이 있으시면 기여해 주세요! GitHub에서 편집
Source fingerprint (SHA-256):
92b8a7a4f9508632155a5f69707ffc4a14f2f44c04e4d01bf46476a972465592