ElevenLabsTextToDialogue - ComfyUI Built-in Node Documentation

ElevenLabs 文本转对话节点可根据文本生成多说话人音频对话。您可以通过指定不同的文本行和每个参与者的独特声音来创建对话。该节点将对话请求发送至 ElevenLabs API，并返回生成的音频。

输入

参数	描述	数据类型	是否必填	范围
`稳定性`	声音稳定性。较低的值可提供更广泛的情感范围，较高的值则产生更一致但可能单调的语音。（默认值：0.5）	FLOAT	否	0.0 - 1.0
`应用文本规范化`	文本规范化模式。‘auto’ 让系统决定，‘on’ 始终应用规范化，‘off’ 跳过规范化。	COMBO	否	`"auto"` `"on"` `"off"`
`模型`	用于对话生成的模型。	COMBO	否	`"eleven_v3"`
`对话条数`	对话条目数量。选择一个数字将生成相应数量的文本和语音输入字段。	DYNAMICCOMBO	是	`"1"` `"2"` `"3"` `"4"` `"5"` `"6"` `"7"` `"8"` `"9"` `"10"`
`语言代码`	ISO-639-1 或 ISO-639-3 语言代码（例如 ‘en’、‘es’、‘fra’）。留空则自动检测。（默认值：空）	STRING	否	-
`种子`	用于结果可复现的随机种子。（默认值：1）	INT	否	0 - 4294967295
`输出格式`	音频输出格式。	COMBO	否	`"mp3_44100_192"` `"opus_48000_192"`

注意： inputs 参数是动态的。当您选择一个数字（例如 “3”）时，节点将显示三个对应的 text 和 voice 输入字段（例如 text1、voice1、text2、voice2、text3、voice3）。每个 text 字段必须至少包含一个字符。

输出

输出名称	描述	数据类型
`audio`	以所选输出格式生成的多说话人对话音频。	AUDIO

本文档由 AI 生成。如果您发现任何错误或有改进建议，欢迎贡献！在 GitHub 上编辑

Source fingerprint (SHA-256): 2e1634e90314167320d715346f8d0c691dfabe82b090391afa2b0b18a8a126d8

​输入

​输出

输入

输出