Stability AI Stable Audio 2.5 API 节点允许你使用 Stability AI 最新的音频生成模型,通过文本提示、音频转换和音频修复功能来创建高质量音乐。 Stable Audio 2.5 专为企业使用而设计,具有改进的音乐结构、更好的提示遵循能力,以及能够在几秒钟内生成长达数分钟的作品。该模型提供三种主要工作流:文本转音频用于从描述生成音乐,音频转音频用于将现有音频转换为新作品,音频修复用于完成或扩展现有音轨。 Stable Audio 2.5 完全基于授权音频训练,商业安全,非常适合需要专业级音频生成且具有企业级可靠性的广告商、游戏工作室和内容创作者。
使用 API 节点需要保证你已经正常登录,并在受许可的网络环境下使用,请参考API 节点总览部分文档来了解使用 API 节点的具体使用要求。
请确保你的 ComfyUI 已经更新。本指南里的工作流可以在 ComfyUI 的工作流模板中找到。如果找不到,可能是 ComfyUI 没有更新。如果加载工作流时有节点缺失,可能原因有:
  1. 你用的不是最新开发版(nightly)。
  2. 你用的是稳定版或桌面版(没有包含最新的更新)。
  3. 启动时有些节点导入失败。

文本转音频工作流

对于文本转音频,你可以通过文本提示生成音频。你需要描述想要生成的音乐。

下载 JSON 工作流

workflow
  1. 修改文本提示。你应该使用关键词来描述想要生成的音乐。
  2. (可选)修改 duration 参数。默认为 190
  3. 点击 Run 按钮或使用快捷键 Ctrl(cmd) + Enter 来执行音频生成。音频将保存到 ComfyUI/output/audio 目录。

音频转音频工作流

音频转音频基本上是音乐重采样。你可以使用它从给定的音乐片段生成新音乐,或者你可以哼唱一段旋律,然后模型将基于输入音频生成新音乐。

下载 JSON 工作流

下载输入音频

workflow
  1. 在此工作流中,我们提供了两个节点来输入你想要编辑的音频(至少 6 秒):
    • 1.1 Record Audio 节点:你可以使用它录制任何音乐想法,例如哼唱的旋律。
    • 1.2 LoadAudio 节点:你可以使用它上传要在此工作流中使用的音频。
  2. 修改文本提示。你应该使用关键词来描述想要生成的音乐。
  3. strength 参数用于控制与原始音频的差异。值越低,生成的音频与原始音频越相似。
  4. 点击 Run 按钮或使用快捷键 Ctrl(cmd) + Enter 来执行音频生成。音频将保存到 ComfyUI/output/audio 目录。

音频修复工作流

音频修复用于完成或扩展现有音轨。你可以使用它来完成音乐的缺失部分,或将音乐扩展到更长的时长。 你需要设置想要开始和结束修复的位置。

下载 JSON 工作流

下载输入音频

workflow
  1. 将音频上传到 LoadAudio 节点。
  2. 修改文本提示。你应该使用关键词来描述想要生成的音乐。
  3. (可选)修改 duration 参数。默认为 190
  4. (重要)修改 mask_startmask_end 参数。你需要设置想要开始和结束修复的位置。
  5. 点击 Run 按钮或使用快捷键 Ctrl(cmd) + Enter 来执行音频生成。音频将保存到 ComfyUI/output/audio 目录。