メインコンテンツへスキップ
以下が翻訳結果です。

概要

このノードは、音声入力を処理して特徴量を抽出し、動画生成モデルのガイドに使用できるようにします。音声を解析してテンポ、ビート、その他の音楽的特徴を検出し、これらの情報を動画モデルの条件付けに適した形式にパッケージ化することで、生成された動画を音声と同期させることができます。

入力

パラメータ説明データ型必須範囲
audio分析およびエンコードされる音声入力です。AUDIOはい-
video_framesターゲット動画のフレーム数です。同期のためのフレームレート計算に使用されます(デフォルト: 149)。INTはい最小: 1、最大: 268435456 (MAX_RESOLUTION)、ステップ: 4
audio_inject_scale動画モデルに注入する際の音声特徴量のスケールです(デフォルト: 1.0)。FLOATはい最小: 0.0、最大: 10.0、ステップ: 0.01

出力

出力名説明データ型
fps_string処理済みの音声特徴量、計算されたフレームレート(fps)、および音声注入スケールを含む辞書です。この出力は動画生成モデルの条件付けに使用されます。AUDIO_ENCODER_OUTPUT
fps_string音声の長さと動画のフレーム数に基づいて計算されたフレームレート(fps)を説明するテキスト文字列です。この文字列は動画モデルのプロンプトで使用することを目的としています。STRING
このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください! GitHub で編集

Source fingerprint (SHA-256): ef230c92b23a04369708041b2e5d03c1b2928edf746dc43020bae777f9f0b589