入力
| パラメータ | 説明 | データ型 | 必須 | 範囲 |
|---|---|---|---|---|
voice | 音声合成に使用する音声です。Voice Selector または Instant Voice Clone から接続します。 | CUSTOM | はい | なし |
text | 音声に変換するテキストです。 | STRING | はい | なし |
stability | 音声の安定性です。値が低いと感情表現の幅が広がり、値が高いとより一貫性のある、ただし単調になりがちな音声になります(デフォルト: 0.5)。 | FLOAT | いいえ | 0.0 - 1.0 |
apply_text_normalization | テキスト正規化モードです。“auto” はシステムが判断し、“on” は常に正規化を適用し、“off” はスキップします。 | COMBO | いいえ | "auto""on""off" |
model | テキスト読み上げに使用するモデルです。モデルを選択すると、そのモデル固有のパラメータが表示されます。 | DYNAMICCOMBO | いいえ | "eleven_multilingual_v2""eleven_v3" |
language_code | ISO-639-1 または ISO-639-3 言語コードです(例: ‘en’, ‘es’, ‘fra’)。自動検出の場合は空のままにします(デフォルト: "")。 | STRING | いいえ | なし |
seed | 再現性のためのシード値です(決定性は保証されません)(デフォルト: 1)。 | INT | いいえ | 0 - 2147483647 |
output_format | 音声出力フォーマットです。 | COMBO | いいえ | "mp3_44100_192""opus_48000_192" |
model パラメータが "eleven_multilingual_v2" に設定されている場合、以下の追加パラメータが使用可能になります。
speed: 音声の速度です。1.0 が標準で、<1.0 で遅く、>1.0 で速くなります(デフォルト: 1.0、範囲: 0.7 - 1.3)。similarity_boost: 類似性の強調です。値が高いほど、元の音声に近くなります(デフォルト: 0.75、範囲: 0.0 - 1.0)。use_speaker_boost: 元の話者の音声への類似性を強調します(デフォルト: False)。style: スタイルの誇張です。値が高いとスタイル表現が強まりますが、安定性が低下する可能性があります(デフォルト: 0.0、範囲: 0.0 - 0.2)。
model パラメータが "eleven_v3" に設定されている場合、以下の追加パラメータが使用可能になります。
speed: 音声の速度です。1.0 が標準で、<1.0 で遅く、>1.0 で速くなります(デフォルト: 1.0、範囲: 0.7 - 1.3)。similarity_boost: 類似性の強調です。値が高いほど、元の音声に近くなります(デフォルト: 0.75、範囲: 0.0 - 1.0)。
出力
| 出力名 | 説明 | データ型 |
|---|---|---|
audio | テキスト読み上げ変換によって生成された音声です。 | AUDIO |
このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください! GitHub で編集
Source fingerprint (SHA-256):
d11d4ffa2d1f11dfd5ce378d9496cd9788d2197bf7f4135092ecefb287f3c2f7