输入
| 参数 | 描述 | 数据类型 | 是否必填 | 范围 |
|---|---|---|---|---|
稳定性 | 声音稳定性。较低的值可提供更广泛的情感范围,较高的值则产生更一致但可能单调的语音。(默认值:0.5) | FLOAT | 否 | 0.0 - 1.0 |
应用文本规范化 | 文本规范化模式。‘auto’ 让系统决定,‘on’ 始终应用规范化,‘off’ 跳过规范化。 | COMBO | 否 | "auto""on""off" |
模型 | 用于对话生成的模型。 | COMBO | 否 | "eleven_v3" |
对话条数 | 对话条目数量。选择一个数字将生成相应数量的文本和语音输入字段。 | DYNAMICCOMBO | 是 | "1""2""3""4""5""6""7""8""9""10" |
语言代码 | ISO-639-1 或 ISO-639-3 语言代码(例如 ‘en’、‘es’、‘fra’)。留空则自动检测。(默认值:空) | STRING | 否 | - |
种子 | 用于结果可复现的随机种子。(默认值:1) | INT | 否 | 0 - 4294967295 |
输出格式 | 音频输出格式。 | COMBO | 否 | "mp3_44100_192""opus_48000_192" |
inputs 参数是动态的。当您选择一个数字(例如 “3”)时,节点将显示三个对应的 text 和 voice 输入字段(例如 text1、voice1、text2、voice2、text3、voice3)。每个 text 字段必须至少包含一个字符。
输出
| 输出名称 | 描述 | 数据类型 |
|---|---|---|
audio | 以所选输出格式生成的多说话人对话音频。 | AUDIO |
本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑
Source fingerprint (SHA-256):
2e1634e90314167320d715346f8d0c691dfabe82b090391afa2b0b18a8a126d8