Stability AI Stable Audio 2.5 API 节点 ComfyUI 官方工作流示例

Stability AI Stable Audio 2.5 API 节点允许你使用 Stability AI 最新的音频生成模型，通过文本提示、音频转换和音频修复功能来创建高质量音乐。 Stable Audio 2.5 专为企业使用而设计，具有改进的音乐结构、更好的提示遵循能力，以及能够在几秒钟内生成长达数分钟的作品。该模型提供三种主要工作流：文本转音频用于从描述生成音乐，音频转音频用于将现有音频转换为新作品，音频修复用于完成或扩展现有音轨。 Stable Audio 2.5 完全基于授权音频训练，商业安全，非常适合需要专业级音频生成且具有企业级可靠性的广告商、游戏工作室和内容创作者。

使用 API 节点需要保证你已经正常登录，并在受许可的网络环境下使用，请参考API 节点总览部分文档来了解使用 API 节点的具体使用要求。

请确保你的 ComfyUI 已经更新。

本指南里的工作流可以在 ComfyUI 的工作流模板中找到。如果找不到，可能是 ComfyUI 没有更新。如果加载工作流时有节点缺失，可能原因有：

你用的不是最新开发版（nightly）。
你用的是稳定版或桌面版（没有包含最新的更新）。
启动时有些节点导入失败。

文本转音频工作流

对于文本转音频，你可以通过文本提示生成音频。你需要描述想要生成的音乐。

下载 JSON 工作流

修改文本提示。你应该使用关键词来描述想要生成的音乐。
（可选）修改 duration 参数。默认为 190。
点击 Run 按钮或使用快捷键 Ctrl(cmd) + Enter 来执行音频生成。音频将保存到 ComfyUI/output/audio 目录。

音频转音频工作流

音频转音频基本上是音乐重采样。你可以使用它从给定的音乐片段生成新音乐，或者你可以哼唱一段旋律，然后模型将基于输入音频生成新音乐。

下载 JSON 工作流

下载输入音频

在此工作流中，我们提供了两个节点来输入你想要编辑的音频（至少 6 秒）：
- 1.1 Record Audio 节点：你可以使用它录制任何音乐想法，例如哼唱的旋律。
- 1.2 LoadAudio 节点：你可以使用它上传要在此工作流中使用的音频。
修改文本提示。你应该使用关键词来描述想要生成的音乐。
strength 参数用于控制与原始音频的差异。值越低，生成的音频与原始音频越相似。
点击 Run 按钮或使用快捷键 Ctrl(cmd) + Enter 来执行音频生成。音频将保存到 ComfyUI/output/audio 目录。

音频修复工作流

音频修复用于完成或扩展现有音轨。你可以使用它来完成音乐的缺失部分，或将音乐扩展到更长的时长。你需要设置想要开始和结束修复的位置。

下载 JSON 工作流

下载输入音频

将音频上传到 LoadAudio 节点。
修改文本提示。你应该使用关键词来描述想要生成的音乐。
（可选）修改 duration 参数。默认为 190。
（重要）修改 mask_start 和 mask_end 参数。你需要设置想要开始和结束修复的位置。
点击 Run 按钮或使用快捷键 Ctrl(cmd) + Enter 来执行音频生成。音频将保存到 ComfyUI/output/audio 目录。

开始使用

基础概念

界面指南

教程示例

故障排除

社区

Stability AI Stable Audio 2.5 API 节点 ComfyUI 官方工作流示例

文本转音频工作流

音频转音频工作流

音频修复工作流

开始使用

基础概念

界面指南

教程示例

故障排除

社区

​文本转音频工作流

​音频转音频工作流

​音频修复工作流

文本转音频工作流

音频转音频工作流

音频修复工作流