메인 콘텐츠로 건너뛰기

Kling 립싱크 오디오-투-비디오 노드

Kling 립싱크 오디오-투-비디오 노드는 비디오 파일의 입 움직임을 오디오 파일의 음성 내용과 동기화합니다. 이 노드는 오디오의 음성 패턴을 분석하고 비디오의 얼굴 움직임을 조정하여 사실적인 립싱크를 생성합니다. 이 과정에는 뚜렷한 얼굴이 포함된 비디오와 명확하게 구분되는 음성이 포함된 오디오 파일이 모두 필요합니다.

입력

매개변수설명데이터 타입필수범위
비디오립싱크할 얼굴이 포함된 비디오 파일VIDEO-
오디오비디오와 동기화할 음성이 포함된 오디오 파일AUDIO-
음성 언어오디오 파일에 포함된 음성의 언어 (기본값: “en”)COMBO"en"
"zh"
"es"
"fr"
"de"
"it"
"pt"
"pl"
"tr"
"ru"
"nl"
"cs"
"ar"
"ja"
"hu"
"ko"
중요 제약 사항:
  • 오디오 파일은 5MB를 초과할 수 없습니다
  • 비디오 파일은 100MB를 초과할 수 없습니다
  • 비디오의 가로/세로 크기는 720px에서 1920px 사이여야 합니다
  • 비디오 길이는 2초에서 10초 사이여야 합니다
  • 오디오에는 명확하게 구분되는 음성이 포함되어야 합니다
  • 비디오에는 뚜렷한 얼굴이 포함되어야 합니다

출력

출력 이름설명데이터 타입
비디오 ID립싱크된 입 움직임이 적용된 처리된 비디오VIDEO
재생 시간처리된 비디오의 고유 식별자STRING
duration처리된 비디오의 길이STRING
이 문서는 AI에 의해 생성되었습니다. 오류를 발견하거나 개선 제안이 있으시면 기여해 주세요! GitHub에서 편집

Source fingerprint (SHA-256): 92b8a7a4f9508632155a5f69707ffc4a14f2f44c04e4d01bf46476a972465592