跳转到主要内容

概述

Kling Avatar 2.0 节点可根据单张参考照片和音频文件生成广播级数字人视频。该节点能创建说话头像视频,并支持通过可选文本提示定义数字人的动作、表情及镜头运动。

输入

参数说明数据类型是否必填取值范围
image数字人参考图像。宽度和高度必须至少为300像素。宽高比需在1:2.5至2.5:1之间。IMAGE-
sound_file音频输入。时长必须在2至300秒之间。AUDIO-
mode使用的生成模式。COMBO"std"
"pro"
prompt可选提示词,用于定义数字人动作、表情及镜头运动。(默认值:空字符串)STRING-
seed种子控制节点是否重新运行;无论种子如何,结果均非确定性。(默认值:0)INT0 至 2147483647
注意: imagesound_file 输入具有特定验证要求。图像必须至少为300x300像素,宽高比在1:2.5至2.5:1之间。音频文件时长必须在2至300秒之间。

输出

输出名称说明数据类型
output生成的数字人视频。VIDEO
本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑

Source fingerprint (SHA-256): 85793d3820a89ef98bb54cb930486847d4fd64cce5470ba34574ec319f8ea8c6