Documentation Index
Fetch the complete documentation index at: https://docs.comfy.org/llms.txt
Use this file to discover all available pages before exploring further.
このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください! GitHub で編集以下は、ご指定の翻訳ルールに従って英語ドキュメントを日本語に翻訳したものです。
Kling Avatar 2.0 ノードは、1枚の参照写真と音声ファイルから、放送スタイルのデジタルヒューマンビデオを生成します。オプションのテキストプロンプトを使用して、アバターの動作、感情、カメラの動きを定義し、トーキングアバタービデオを作成します。
入力
| パラメータ | データ型 | 必須 | 範囲 | 説明 |
|---|---|---|---|---|
image | IMAGE | はい | - | アバターの参照画像。幅と高さは少なくとも300px以上である必要があります。アスペクト比は1:2.5から2.5:1の間である必要があります。 |
sound_file | AUDIO | はい | - | 音声入力。長さは2秒以上300秒以下である必要があります。 |
mode | COMBO | はい | "std""pro" | 使用する生成モード。 |
prompt | STRING | いいえ | - | アバターの動作、感情、カメラの動きを定義するオプションのプロンプト。(デフォルト:空文字列) |
seed | INT | はい | 0 から 2147483647 | シードはノードを再実行するかどうかを制御します。結果はシードに関係なく非決定的です。(デフォルト:0) |
image と sound_file の入力には特定の検証要件があります。画像は少なくとも300x300ピクセルで、アスペクト比が1:2.5から2.5:1の間である必要があります。音声ファイルは2秒以上300秒以下である必要があります。
出力
| 出力名 | データ型 | 説明 |
|---|---|---|
output | VIDEO | 生成されたデジタルヒューマンビデオ。 |
Source fingerprint (SHA-256):
85793d3820a89ef98bb54cb930486847d4fd64cce5470ba34574ec319f8ea8c6