跳转到主要内容

概述

此节点处理音频输入以提取可用于指导视频生成模型的特征。它分析音频以检测节奏、节拍及其他音乐特征,然后将这些信息打包成适合调节视频模型的格式,从而使生成的视频能够与音频同步。

输入

参数描述数据类型是否必填范围
音频待分析和编码的音频输入。AUDIO-
视频帧目标视频的帧数。用于计算同步所需的帧率(默认值:149)。INT最小值:1,最大值:268435456(MAX_RESOLUTION),步长:4
音频注入比例音频特征注入视频模型时的缩放比例(默认值:1.0)。FLOAT最小值:0.0,最大值:10.0,步长:0.01

输出

输出名称描述数据类型
fps字符串一个字典,包含处理后的音频特征、计算出的帧率(fps)以及音频注入缩放比例。此输出用于调节视频生成模型。AUDIO_ENCODER_OUTPUT
fps_string基于音频长度和视频帧数计算出的帧率(fps)的文本描述。此字符串旨在用于视频模型的提示词中。STRING
本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑

Source fingerprint (SHA-256): ef230c92b23a04369708041b2e5d03c1b2928edf746dc43020bae777f9f0b589