メインコンテンツへスキップ
このドキュメントは AI によって生成されました。誤りを発見された場合、または改善のご提案がある場合は、ぜひご貢献ください!GitHub で編集する
ElevenLabs テキスト読み上げノードは、ElevenLabs API を使用して、テキストを音声オーディオに変換します。特定の音声を選択し、安定性、速度、スタイルなどのさまざまな音声特性を微調整することで、カスタマイズされた音声出力を生成できます。

入力

パラメーターデータ型必須範囲説明
voiceCUSTOMはいN/A音声合成に使用する音声。Voice Selector や Instant Voice Clone から接続します。
textSTRINGはいN/A音声に変換するテキスト。
stabilityFLOATいいえ0.0 – 1.0音声の安定性。値が小さいほど感情表現の幅が広がり、大きいほど一貫性のある(ただし単調になりやすい)音声になります(デフォルト:0.5)。
apply_text_normalizationCOMBOいいえ"auto"
"on"
"off"
テキスト正規化モード。「auto」ではシステムが自動判断、「on」では常に正規化を適用、「off」では正規化をスキップします。
modelDYNAMICCOMBOいいえ"eleven_multilingual_v2"
"eleven_v3"
テキスト読み上げに使用するモデル。モデルを選択すると、そのモデル固有のパラメーターが表示されます。
language_codeSTRINGいいえN/AISO-639-1 または ISO-639-3 の言語コード(例:'en''es''fra')。空欄のままにすると自動検出されます(デフォルト:"")。
seedINTいいえ0 – 2147483647再現性のためのシード値(決定論的保証はされません)(デフォルト:1)。
output_formatCOMBOいいえ"mp3_44100_192"
"opus_48000_192"
音声出力フォーマット。
モデル固有のパラメーター:
model パラメーターを "eleven_multilingual_v2" に設定した場合、以下の追加パラメーターが利用可能になります:
  • speed: 話す速さ。1.0 が標準で、1.0 より小さいと遅くなり、大きいと速くなります(デフォルト:1.0、範囲:0.7 – 1.3)。
  • similarity_boost: 類似度強調。値が高いほど、元の音声に近い音声になります(デフォルト:0.75、範囲:0.0 – 1.0)。
  • use_speaker_boost: 元の話者の音声との類似度を高めます(デフォルト:False)。
  • style: スタイルの誇張度。値が高いほど表現が強調されますが、安定性が低下する可能性があります(デフォルト:0.0、範囲:0.0 – 0.2)。
model パラメーターを "eleven_v3" に設定した場合、以下の追加パラメーターが利用可能になります:
  • speed: 話す速さ。1.0 が標準で、1.0 より小さいと遅くなり、大きいと速くなります(デフォルト:1.0、範囲:0.7 – 1.3)。
  • similarity_boost: 類似度強調。値が高いほど、元の音声に近い音声になります(デフォルト:0.75、範囲:0.0 – 1.0)。

出力

出力名データ型説明
audioAUDIOテキスト読み上げ変換によって生成された音声データ。