メインコンテンツへスキップ
このドキュメンテーションは AI によって生成されました。誤りを発見された場合、または改善の提案をお持ちの場合には、ぜひご貢献ください! GitHub で編集する
Kling 唇形同期(リップシンク)テキストから動画へ変換するノードは、動画ファイル内の口の動きをテキストプロンプトと同期させます。このノードは入力動画を受け取り、キャラクターの唇の動きが提供されたテキスト内容と一致する新しい動画を生成します。ノードは音声合成技術を用いて、自然でリアルな発話同期効果を実現します。

入力

パラメーターデータ型必須範囲説明
videoVIDEOはい-リップシンク処理用の入力動画ファイル
textSTRINGはい-リップシンク動画生成用のテキスト内容。モードが text2video の場合に必須です。最大長は 120 文字です。
voiceCOMBOいいえ”Melody"
"Bella"
"Aria"
"Ethan"
"Ryan"
"Dorothy"
"Nathan"
"Lily"
"Aaron"
"Emma"
"Grace"
"Henry"
"Isabella"
"James"
"Katherine"
"Liam"
"Mia"
"Noah"
"Olivia"
"Sophia”
リップシンク音声用の音声選択(デフォルト: “Melody”)
voice_speedFLOATいいえ0.8–2.0話速(スピーチレート)。有効範囲:0.8~2.0(小数点以下1桁まで精度可)。デフォルト値:1
動画ファイルの要件:
  • 動画ファイルサイズは 100MB を超えてはいけません
  • 解像度(高さ/幅)は 720px ~ 1920px の範囲内である必要があります
  • 再生時間は 2秒 ~ 10秒 の範囲内である必要があります

出力

出力名データ型説明
outputVIDEOリップシンク音声を含む生成動画
video_idSTRING生成された動画の固有識別子(ID)
durationSTRING生成された動画の再生時間情報