Kling Lip Sync Text to Video Node は、動画ファイル内の口の動きをテキストプロンプトに同期させます。入力動画を元に、キャラクターの口の動きが指定されたテキストに合わせて調整された新しい動画を生成します。このノードは音声合成を使用して、自然な発話同期を実現します。
入力
| パラメータ | 説明 | データ型 | 必須 | 範囲 |
|---|---|---|---|---|
動画 | リップシンク用の入力動画ファイル | VIDEO | はい | - |
テキスト | リップシンク動画生成用のテキスト内容。モードが text2video の場合に必須です。最大文字数は120文字です。 | STRING | はい | - |
音声 | リップシンク音声用の音声選択(デフォルト:“Melody”) | COMBO | いいえ | ”Melody" "Bella" "Aria" "Ethan" "Ryan" "Dorothy" "Nathan" "Lily" "Aaron" "Emma" "Grace" "Henry" "Isabella" "James" "Katherine" "Liam" "Mia" "Noah" "Olivia" "Sophia” |
話速 | 発話速度。有効範囲:0.8~2.0、小数点第1位まで指定可能(デフォルト:1) | FLOAT | いいえ | 0.8-2.0 |
- 動画ファイルは100MB以下である必要があります
- 高さ/幅は720px~1920pxの間である必要があります
- 長さは2秒~10秒の間である必要があります
出力
| 出力名 | 説明 | データ型 |
|---|---|---|
動画ID | リップシンクされた音声付きの生成動画 | VIDEO |
再生時間 | 生成された動画の一意識別子 | STRING |
duration | 生成された動画の長さ情報 | STRING |
このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください! GitHub で編集
Source fingerprint (SHA-256):
f16200d52ba05acfedebc027dde91e2c91bdbb80086888d947c9f56a4e92856d