跳转到主要内容

Documentation Index

Fetch the complete documentation index at: https://docs.comfy.org/llms.txt

Use this file to discover all available pages before exploring further.

本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑

概述

Kling Avatar 2.0 节点可根据单张参考照片和音频文件生成广播级数字人视频。该节点能创建说话头像视频,并支持通过可选文本提示定义数字人的动作、表情及镜头运动。

输入

参数数据类型是否必填取值范围说明
imageIMAGE-数字人参考图像。宽度和高度必须至少为300像素。宽高比需在1:2.5至2.5:1之间。
sound_fileAUDIO-音频输入。时长必须在2至300秒之间。
modeCOMBO"std"
"pro"
使用的生成模式。
promptSTRING-可选提示词,用于定义数字人动作、表情及镜头运动。(默认值:空字符串)
seedINT0 至 2147483647种子控制节点是否重新运行;无论种子如何,结果均非确定性。(默认值:0)
注意: imagesound_file 输入具有特定验证要求。图像必须至少为300x300像素,宽高比在1:2.5至2.5:1之间。音频文件时长必须在2至300秒之间。

输出

输出名称数据类型说明
outputVIDEO生成的数字人视频。

Source fingerprint (SHA-256): 85793d3820a89ef98bb54cb930486847d4fd64cce5470ba34574ec319f8ea8c6