KlingLipSyncAudioToVideoNode - ComfyUI Built-in Node Documentation

Kling 립싱크 오디오-투-비디오 노드는 비디오 파일의 입 움직임을 오디오 파일의 음성 내용과 동기화합니다. 이 노드는 오디오의 음성 패턴을 분석하고 비디오의 얼굴 움직임을 조정하여 사실적인 립싱크를 생성합니다. 이 과정에는 뚜렷한 얼굴이 포함된 비디오와 명확하게 구분되는 음성이 포함된 오디오 파일이 모두 필요합니다.

입력

매개변수	설명	데이터 타입	필수	범위
`비디오`	립싱크할 얼굴이 포함된 비디오 파일	VIDEO	예	-
`오디오`	비디오와 동기화할 음성이 포함된 오디오 파일	AUDIO	예	-
`음성 언어`	오디오 파일에 포함된 음성의 언어 (기본값: “en”)	COMBO	예	`"en"` `"zh"` `"es"` `"fr"` `"de"` `"it"` `"pt"` `"pl"` `"tr"` `"ru"` `"nl"` `"cs"` `"ar"` `"ja"` `"hu"` `"ko"`

중요 제약 사항:

오디오 파일은 5MB를 초과할 수 없습니다
비디오 파일은 100MB를 초과할 수 없습니다
비디오의 가로/세로 크기는 720px에서 1920px 사이여야 합니다
비디오 길이는 2초에서 10초 사이여야 합니다
오디오에는 명확하게 구분되는 음성이 포함되어야 합니다
비디오에는 뚜렷한 얼굴이 포함되어야 합니다

출력

출력 이름	설명	데이터 타입
`비디오 ID`	립싱크된 입 움직임이 적용된 처리된 비디오	VIDEO
`비디오 ID`	처리된 비디오의 고유 식별자	STRING
`재생 시간`	처리된 비디오의 길이	STRING

이 문서는 AI에 의해 생성되었습니다. 오류를 발견하거나 개선 제안이 있으시면 기여해 주세요! GitHub에서 편집

Source fingerprint (SHA-256): 92b8a7a4f9508632155a5f69707ffc4a14f2f44c04e4d01bf46476a972465592

KlingImageToVideoWithAudio - ComfyUI Built-in Node Documentation

KlingLipSyncTextToVideoNode - ComfyUI Built-in Node Documentation

​입력

​출력

입력

출력