メインコンテンツへスキップ
このドキュメントはAIによって生成されました。誤りを発見した場合、または改善のための提案がある場合は、ぜひご貢献ください! GitHubで編集
テキストによる指示を用いて、既存の音声サンプルの一部を変換します。このノードでは、記述的なプロンプトを指定することで音声の特定区間を編集可能であり、指定された部分を「修復(インペイント)」または再生成する一方で、音声の他の部分はそのまま保持します。

入力

パラメーターデータ型必須範囲説明
modelCOMBOはい”stable-audio-2.5”
音声インペイントに使用するAIモデルです。
promptSTRINGはい音声の変換方法を指示するテキスト記述(デフォルト:空文字列)。
audioAUDIOはい変換対象の入力音声ファイルです。音声の長さは6~190秒である必要があります。
durationINTいいえ1–190生成される音声の長さ(単位:秒)を制御します(デフォルト:190)。
seedINTいいえ0–4294967294生成時に使用される乱数シードです(デフォルト:0)。
stepsINTいいえ4–8サンプリングステップ数を制御します(デフォルト:8)。
mask_startINTいいえ0–190変換対象の音声区間の開始位置(単位:秒)です(デフォルト:30)。
mask_endINTいいえ0–190変換対象の音声区間の終了位置(単位:秒)です(デフォルト:190)。
注意: mask_end の値は mask_start の値より大きくなければなりません。また、入力音声の長さは6~190秒の範囲内である必要があります。

出力

出力名データ型説明
audioAUDIOプロンプトに基づき指定区間が変更された、変換後の音声出力です。