Kling Avatar 2.0 ノードは、1枚の参照写真と音声ファイルから、放送スタイルのデジタルヒューマンビデオを生成します。オプションのテキストプロンプトを使用して、アバターの動作、感情、カメラの動きを定義し、トーキングアバタービデオを作成します。
入力
| パラメータ | 説明 | データ型 | 必須 | 範囲 |
|---|---|---|---|---|
image | アバターの参照画像。幅と高さは少なくとも300px以上である必要があります。アスペクト比は1:2.5から2.5:1の間である必要があります。 | IMAGE | はい | - |
sound_file | 音声入力。長さは2秒以上300秒以下である必要があります。 | AUDIO | はい | - |
mode | 使用する生成モード。 | COMBO | はい | "std""pro" |
prompt | アバターの動作、感情、カメラの動きを定義するオプションのプロンプト。(デフォルト:空文字列) | STRING | いいえ | - |
seed | シードはノードを再実行するかどうかを制御します。結果はシードに関係なく非決定的です。(デフォルト:0) | INT | はい | 0 から 2147483647 |
image と sound_file の入力には特定の検証要件があります。画像は少なくとも300x300ピクセルで、アスペクト比が1:2.5から2.5:1の間である必要があります。音声ファイルは2秒以上300秒以下である必要があります。
出力
| 出力名 | 説明 | データ型 |
|---|---|---|
output | 生成されたデジタルヒューマンビデオ。 | VIDEO |
このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください! GitHub で編集
Source fingerprint (SHA-256):
85793d3820a89ef98bb54cb930486847d4fd64cce5470ba34574ec319f8ea8c6