ElevenLabsTextToSpeech - ComfyUI Built-in Node Documentation

ElevenLabs 텍스트 음성 변환 노드는 ElevenLabs API를 사용하여 작성된 텍스트를 음성 오디오로 변환합니다. 특정 음성을 선택하고 안정성, 속도, 스타일과 같은 다양한 음성 특성을 미세 조정하여 맞춤형 오디오 출력을 생성할 수 있습니다.

입력

매개변수	설명	데이터 타입	필수 여부	범위
`voice`	음성 합성에 사용할 음성입니다. 음성 선택기 또는 즉시 음성 복제에서 연결하세요.	CUSTOM	예	해당 없음
`text`	음성으로 변환할 텍스트입니다.	STRING	예	해당 없음
`stability`	음성 안정성입니다. 값이 낮을수록 더 넓은 감정 표현 범위를 제공하고, 값이 높을수록 더 일관되지만 단조로운 음성을 생성합니다(기본값: 0.5).	FLOAT	아니요	0.0 - 1.0
`apply_text_normalization`	텍스트 정규화 모드입니다. ‘auto’는 시스템이 결정하도록 하고, ‘on’은 항상 정규화를 적용하며, ‘off’는 정규화를 건너뜁니다.	COMBO	아니요	`"auto"` `"on"` `"off"`
`model`	텍스트 음성 변환에 사용할 모델입니다. 모델을 선택하면 해당 모델의 특정 매개변수가 표시됩니다.	DYNAMICCOMBO	아니요	`"eleven_multilingual_v2"` `"eleven_v3"`
`language_code`	ISO-639-1 또는 ISO-639-3 언어 코드입니다(예: ‘en’, ‘es’, ‘fra’). 자동 감지를 위해 비워 두세요(기본값: "").	STRING	아니요	해당 없음
`seed`	재현성을 위한 시드입니다(결정론적 결과는 보장되지 않음)(기본값: 1).	INT	아니요	0 - 2147483647
`output_format`	오디오 출력 형식입니다.	COMBO	아니요	`"mp3_44100_192"` `"opus_48000_192"`

모델별 매개변수: model 매개변수가 "eleven_multilingual_v2"로 설정된 경우 다음 추가 매개변수를 사용할 수 있습니다:

speed: 음성 속도입니다. 1.0은 보통, <1.0은 느리게, >1.0은 빠르게 설정합니다(기본값: 1.0, 범위: 0.7 - 1.3).
similarity_boost: 유사도 향상입니다. 값이 높을수록 음성이 원본과 더 유사해집니다(기본값: 0.75, 범위: 0.0 - 1.0).
use_speaker_boost: 원본 화자 음성과의 유사도를 향상시킵니다(기본값: False).
style: 스타일 강조입니다. 값이 높을수록 스타일 표현이 증가하지만 안정성이 감소할 수 있습니다(기본값: 0.0, 범위: 0.0 - 0.2).

model 매개변수가 "eleven_v3"로 설정된 경우 다음 추가 매개변수를 사용할 수 있습니다:

speed: 음성 속도입니다. 1.0은 보통, <1.0은 느리게, >1.0은 빠르게 설정합니다(기본값: 1.0, 범위: 0.7 - 1.3).
similarity_boost: 유사도 향상입니다. 값이 높을수록 음성이 원본과 더 유사해집니다(기본값: 0.75, 범위: 0.0 - 1.0).

출력 이름	설명	데이터 타입
`audio`	텍스트 음성 변환으로 생성된 오디오입니다.	AUDIO

이 문서는 AI에 의해 생성되었습니다. 오류를 발견하거나 개선 제안이 있으시면 기여해 주세요! GitHub에서 편집

Source fingerprint (SHA-256): d11d4ffa2d1f11dfd5ce378d9496cd9788d2197bf7f4135092ecefb287f3c2f7