メインコンテンツへスキップ
以下が翻訳結果です。

概要

Kling リップシンク音声動画ノードは、動画ファイル内の口の動きを音声ファイルのオーディオコンテンツに同期させます。このノードは、音声内の音声パターンを分析し、動画内の顔の動きを調整して、リアルなリップシンクを実現します。この処理には、明確な顔が含まれる動画と、はっきりと識別できる音声が含まれる音声ファイルの両方が必要です。

入力

パラメータ説明データ型必須範囲
動画リップシンク対象の顔が含まれる動画ファイルVIDEOはい-
音声動画と同期する音声が含まれる音声ファイルAUDIOはい-
音声言語音声ファイル内の音声の言語(デフォルト: “en”)COMBOはい"en"
"zh"
"es"
"fr"
"de"
"it"
"pt"
"pl"
"tr"
"ru"
"nl"
"cs"
"ar"
"ja"
"hu"
"ko"
重要な制約事項:
  • 音声ファイルは5MB以下である必要があります
  • 動画ファイルは100MB以下である必要があります
  • 動画の寸法は、高さ・幅ともに720pxから1920pxの間である必要があります
  • 動画の長さは2秒から10秒の間である必要があります
  • 音声には、はっきりと識別できる音声が含まれている必要があります
  • 動画には、明確な顔が含まれている必要があります

出力

出力名説明データ型
動画ID口の動きがリップシンクされた処理済み動画VIDEO
再生時間処理済み動画の一意識別子STRING
duration処理済み動画の長さSTRING
このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください! GitHub で編集

Source fingerprint (SHA-256): 92b8a7a4f9508632155a5f69707ffc4a14f2f44c04e4d01bf46476a972465592