このドキュメントはAIによって生成されました。誤りを発見した場合、または改善のための提案がある場合は、ぜひご貢献ください! GitHubで編集テキストによる指示を用いて、既存の音声サンプルの一部を変換します。このノードでは、記述的なプロンプトを指定することで音声の特定区間を編集可能であり、指定された部分を「修復(インペイント)」または再生成する一方で、音声の他の部分はそのまま保持します。
入力
| パラメーター | データ型 | 必須 | 範囲 | 説明 |
|---|---|---|---|---|
model | COMBO | はい | ”stable-audio-2.5” | 音声インペイントに使用するAIモデルです。 |
prompt | STRING | はい | — | 音声の変換方法を指示するテキスト記述(デフォルト:空文字列)。 |
audio | AUDIO | はい | — | 変換対象の入力音声ファイルです。音声の長さは6~190秒である必要があります。 |
duration | INT | いいえ | 1–190 | 生成される音声の長さ(単位:秒)を制御します(デフォルト:190)。 |
seed | INT | いいえ | 0–4294967294 | 生成時に使用される乱数シードです(デフォルト:0)。 |
steps | INT | いいえ | 4–8 | サンプリングステップ数を制御します(デフォルト:8)。 |
mask_start | INT | いいえ | 0–190 | 変換対象の音声区間の開始位置(単位:秒)です(デフォルト:30)。 |
mask_end | INT | いいえ | 0–190 | 変換対象の音声区間の終了位置(単位:秒)です(デフォルト:190)。 |
mask_end の値は mask_start の値より大きくなければなりません。また、入力音声の長さは6~190秒の範囲内である必要があります。
出力
| 出力名 | データ型 | 説明 |
|---|---|---|
audio | AUDIO | プロンプトに基づき指定区間が変更された、変換後の音声出力です。 |