このドキュメントは AI によって生成されました。誤りを発見された場合、または改善のご提案がある場合は、ぜひご貢献ください!GitHub で編集するElevenLabs テキスト読み上げノードは、ElevenLabs API を使用して、テキストを音声オーディオに変換します。特定の音声を選択し、安定性、速度、スタイルなどのさまざまな音声特性を微調整することで、カスタマイズされた音声出力を生成できます。
入力
| パラメーター | データ型 | 必須 | 範囲 | 説明 |
|---|---|---|---|---|
voice | CUSTOM | はい | N/A | 音声合成に使用する音声。Voice Selector や Instant Voice Clone から接続します。 |
text | STRING | はい | N/A | 音声に変換するテキスト。 |
stability | FLOAT | いいえ | 0.0 – 1.0 | 音声の安定性。値が小さいほど感情表現の幅が広がり、大きいほど一貫性のある(ただし単調になりやすい)音声になります(デフォルト:0.5)。 |
apply_text_normalization | COMBO | いいえ | "auto""on""off" | テキスト正規化モード。「auto」ではシステムが自動判断、「on」では常に正規化を適用、「off」では正規化をスキップします。 |
model | DYNAMICCOMBO | いいえ | "eleven_multilingual_v2""eleven_v3" | テキスト読み上げに使用するモデル。モデルを選択すると、そのモデル固有のパラメーターが表示されます。 |
language_code | STRING | いいえ | N/A | ISO-639-1 または ISO-639-3 の言語コード(例:'en'、'es'、'fra')。空欄のままにすると自動検出されます(デフォルト:"")。 |
seed | INT | いいえ | 0 – 2147483647 | 再現性のためのシード値(決定論的保証はされません)(デフォルト:1)。 |
output_format | COMBO | いいえ | "mp3_44100_192""opus_48000_192" | 音声出力フォーマット。 |
model パラメーターを "eleven_multilingual_v2" に設定した場合、以下の追加パラメーターが利用可能になります:
speed: 話す速さ。1.0 が標準で、1.0 より小さいと遅くなり、大きいと速くなります(デフォルト:1.0、範囲:0.7 – 1.3)。similarity_boost: 類似度強調。値が高いほど、元の音声に近い音声になります(デフォルト:0.75、範囲:0.0 – 1.0)。use_speaker_boost: 元の話者の音声との類似度を高めます(デフォルト:False)。style: スタイルの誇張度。値が高いほど表現が強調されますが、安定性が低下する可能性があります(デフォルト:0.0、範囲:0.0 – 0.2)。
model パラメーターを "eleven_v3" に設定した場合、以下の追加パラメーターが利用可能になります:
speed: 話す速さ。1.0 が標準で、1.0 より小さいと遅くなり、大きいと速くなります(デフォルト:1.0、範囲:0.7 – 1.3)。similarity_boost: 類似度強調。値が高いほど、元の音声に近い音声になります(デフォルト:0.75、範囲:0.0 – 1.0)。
出力
| 出力名 | データ型 | 説明 |
|---|---|---|
audio | AUDIO | テキスト読み上げ変換によって生成された音声データ。 |