概要
このノードは、音声入力を処理して特徴量を抽出し、動画生成モデルのガイドに使用できるようにします。音声を解析してテンポ、ビート、その他の音楽的特徴を検出し、これらの情報を動画モデルの条件付けに適した形式にパッケージ化することで、生成された動画を音声と同期させることができます。入力
| パラメータ | 説明 | データ型 | 必須 | 範囲 |
|---|---|---|---|---|
audio | 分析およびエンコードされる音声入力です。 | AUDIO | はい | - |
video_frames | ターゲット動画のフレーム数です。同期のためのフレームレート計算に使用されます(デフォルト: 149)。 | INT | はい | 最小: 1、最大: 268435456 (MAX_RESOLUTION)、ステップ: 4 |
audio_inject_scale | 動画モデルに注入する際の音声特徴量のスケールです(デフォルト: 1.0)。 | FLOAT | はい | 最小: 0.0、最大: 10.0、ステップ: 0.01 |
出力
| 出力名 | 説明 | データ型 |
|---|---|---|
fps_string | 処理済みの音声特徴量、計算されたフレームレート(fps)、および音声注入スケールを含む辞書です。この出力は動画生成モデルの条件付けに使用されます。 | AUDIO_ENCODER_OUTPUT |
fps_string | 音声の長さと動画のフレーム数に基づいて計算されたフレームレート(fps)を説明するテキスト文字列です。この文字列は動画モデルのプロンプトで使用することを目的としています。 | STRING |
このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください! GitHub で編集
Source fingerprint (SHA-256):
ef230c92b23a04369708041b2e5d03c1b2928edf746dc43020bae777f9f0b589