メインコンテンツへスキップ
VAEEncodeAudio ノードは、Variational Autoencoder(VAE)を使用してオーディオデータを潜在表現に変換します。オーディオ入力を受け取り、VAE を通して処理することで、さらなるオーディオ生成や操作タスクに使用できる圧縮された潜在サンプルを生成します。このノードは、必要に応じてエンコード前にオーディオを VAE の期待するサンプルレートに自動的にリサンプリングします。

入力

パラメータ説明データ型必須範囲
オーディオエンコードするオーディオデータ。波形とサンプルレートの情報を含みますAUDIOはい-
vaeオーディオを潜在空間にエンコードするために使用される Variational Autoencoder モデルVAEはい-
注記: オーディオ入力は、元のサンプルレートが VAE の期待するサンプルレート(デフォルト:44100 Hz)と異なる場合、自動的にリサンプリングされます。

出力

出力名説明データ型
LATENT潜在空間におけるエンコードされたオーディオ表現。圧縮されたサンプルを含みますLATENT
このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください! GitHub で編集

Source fingerprint (SHA-256): db509ab571154c4cedbfc6cae6591bd2b67b2c6e2261766565cdb0205b2c2ecc