メインコンテンツへスキップ
このドキュメンテーションは AI によって生成されました。誤りを発見された場合、または改善のご提案がある場合は、ぜひご貢献ください! GitHub で編集する
VAEEncodeAudio ノードは、変分オートエンコーダ(VAE)を用いて音声データを潜在表現に変換します。このノードは音声入力を受信し、VAE を通じて処理することで、圧縮された潜在サンプルを生成します。これらの潜在サンプルは、その後の音声生成や音声処理などのタスクに利用できます。また、必要に応じて、エンコード前に音声を自動的に 44100 Hz にリサンプリングします。

入力

パラメーターデータ型必須範囲説明
audioAUDIOはい-エンコード対象の音声データ。波形およびサンプルレート情報を含む
vaeVAEはい-音声を潜在空間へエンコードするために使用される変分オートエンコーダモデル
注意: 元のサンプルレートが 44100 Hz と異なる場合、音声入力は自動的に 44100 Hz へリサンプリングされます。

出力

出力名データ型説明
LATENTLATENT潜在空間におけるエンコード済み音声表現。圧縮されたサンプルを含む