KlingAvatarNode - ComfyUI Built-in Node Documentation

以下は、ご指定の翻訳ルールに従って英語ドキュメントを日本語に翻訳したものです。

Kling Avatar 2.0 ノードは、1枚の参照写真と音声ファイルから、放送スタイルのデジタルヒューマンビデオを生成します。オプションのテキストプロンプトを使用して、アバターの動作、感情、カメラの動きを定義し、トーキングアバタービデオを作成します。

入力

パラメータ	説明	データ型	必須	範囲
`image`	アバターの参照画像。幅と高さは少なくとも300px以上である必要があります。アスペクト比は1:2.5から2.5:1の間である必要があります。	IMAGE	はい	-
`sound_file`	音声入力。長さは2秒以上300秒以下である必要があります。	AUDIO	はい	-
`mode`	使用する生成モード。	COMBO	はい	`"std"` `"pro"`
`prompt`	アバターの動作、感情、カメラの動きを定義するオプションのプロンプト。（デフォルト：空文字列）	STRING	いいえ	-
`seed`	シードはノードを再実行するかどうかを制御します。結果はシードに関係なく非決定的です。（デフォルト：0）	INT	はい	0 から 2147483647

注記： image と sound_file の入力には特定の検証要件があります。画像は少なくとも300x300ピクセルで、アスペクト比が1:2.5から2.5:1の間である必要があります。音声ファイルは2秒以上300秒以下である必要があります。

出力名	説明	データ型
`output`	生成されたデジタルヒューマンビデオ。	VIDEO

このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください！ GitHub で編集

Source fingerprint (SHA-256): 85793d3820a89ef98bb54cb930486847d4fd64cce5470ba34574ec319f8ea8c6