メインコンテンツへスキップ

Documentation Index

Fetch the complete documentation index at: https://docs.comfy.org/llms.txt

Use this file to discover all available pages before exploring further.

このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください! GitHub で編集
以下が翻訳結果です。

概要

このノードは、音声入力を処理して特徴量を抽出し、動画生成モデルのガイドに使用できるようにします。音声を解析してテンポ、ビート、その他の音楽的特徴を検出し、これらの情報を動画モデルの条件付けに適した形式にパッケージ化することで、生成された動画を音声と同期させることができます。

入力

パラメータデータ型必須範囲説明
audioAUDIOはい-分析およびエンコードされる音声入力です。
video_framesINTはい最小: 1、最大: 268435456 (MAX_RESOLUTION)、ステップ: 4ターゲット動画のフレーム数です。同期のためのフレームレート計算に使用されます(デフォルト: 149)。
audio_inject_scaleFLOATはい最小: 0.0、最大: 10.0、ステップ: 0.01動画モデルに注入する際の音声特徴量のスケールです(デフォルト: 1.0)。

出力

出力名データ型説明
fps_stringAUDIO_ENCODER_OUTPUT処理済みの音声特徴量、計算されたフレームレート(fps)、および音声注入スケールを含む辞書です。この出力は動画生成モデルの条件付けに使用されます。
fps_stringSTRING音声の長さと動画のフレーム数に基づいて計算されたフレームレート(fps)を説明するテキスト文字列です。この文字列は動画モデルのプロンプトで使用することを目的としています。

Source fingerprint (SHA-256): ef230c92b23a04369708041b2e5d03c1b2928edf746dc43020bae777f9f0b589