跳转到主要内容

Documentation Index

Fetch the complete documentation index at: https://docs.comfy.org/llms.txt

Use this file to discover all available pages before exploring further.

本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑

概述

此节点处理音频输入以提取可用于指导视频生成模型的特征。它分析音频以检测节奏、节拍及其他音乐特征,然后将这些信息打包成适合调节视频模型的格式,从而使生成的视频能够与音频同步。

输入

参数数据类型是否必填范围描述
音频AUDIO-待分析和编码的音频输入。
视频帧INT最小值:1,最大值:268435456(MAX_RESOLUTION),步长:4目标视频的帧数。用于计算同步所需的帧率(默认值:149)。
音频注入比例FLOAT最小值:0.0,最大值:10.0,步长:0.01音频特征注入视频模型时的缩放比例(默认值:1.0)。

输出

输出名称数据类型描述
fps字符串AUDIO_ENCODER_OUTPUT一个字典,包含处理后的音频特征、计算出的帧率(fps)以及音频注入缩放比例。此输出用于调节视频生成模型。
fps_stringSTRING基于音频长度和视频帧数计算出的帧率(fps)的文本描述。此字符串旨在用于视频模型的提示词中。

Source fingerprint (SHA-256): ef230c92b23a04369708041b2e5d03c1b2928edf746dc43020bae777f9f0b589