メインコンテンツへスキップ

Documentation Index

Fetch the complete documentation index at: https://docs.comfy.org/llms.txt

Use this file to discover all available pages before exploring further.

このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください! GitHub で編集
以下は、ご指定の翻訳ルールに従って英語ドキュメントを日本語に翻訳したものです。
Kling Avatar 2.0 ノードは、1枚の参照写真と音声ファイルから、放送スタイルのデジタルヒューマンビデオを生成します。オプションのテキストプロンプトを使用して、アバターの動作、感情、カメラの動きを定義し、トーキングアバタービデオを作成します。

入力

パラメータデータ型必須範囲説明
imageIMAGEはい-アバターの参照画像。幅と高さは少なくとも300px以上である必要があります。アスペクト比は1:2.5から2.5:1の間である必要があります。
sound_fileAUDIOはい-音声入力。長さは2秒以上300秒以下である必要があります。
modeCOMBOはい"std"
"pro"
使用する生成モード。
promptSTRINGいいえ-アバターの動作、感情、カメラの動きを定義するオプションのプロンプト。(デフォルト:空文字列)
seedINTはい0 から 2147483647シードはノードを再実行するかどうかを制御します。結果はシードに関係なく非決定的です。(デフォルト:0)
注記: imagesound_file の入力には特定の検証要件があります。画像は少なくとも300x300ピクセルで、アスペクト比が1:2.5から2.5:1の間である必要があります。音声ファイルは2秒以上300秒以下である必要があります。

出力

出力名データ型説明
outputVIDEO生成されたデジタルヒューマンビデオ。

Source fingerprint (SHA-256): 85793d3820a89ef98bb54cb930486847d4fd64cce5470ba34574ec319f8ea8c6