本文将引导你在 ComfyUI 中使用 ACE-Step 模型来创造灵动音乐
下载 Json 格式工作流文件
你也可以手动下载ace_step_v1_3.5b.safetensors 后保存到ComfyUI/models/checkpoints
文件夹下
Load Checkpoints
节点加载了 ace_step_v1_3.5b.safetensors
模型EmptyAceStepLatentAudio
节点上你可以设置生成音乐的时长LatentOperationTonemapReinhard
节点,你可以调整 multiplier
来调整人声的音量大小(数字越大,人声音量越明显)TextEncodeAceStepAudio
的 tags
输入对应的音乐风格等等TextEncodeAceStepAudio
的 lyrics
中输入对应的歌词,如果你不知道该输入哪些歌词Run
按钮,或者使用快捷键 Ctrl(cmd) + Enter(回车)
来执行音频的生成。Save Audio
节点中查看生成的音频,你可以点击播放试听,对应的音频也会被保存至 ComfyUI/output/audio
(由Save Audio
节点决定子目录名称)。Ksampler
的 denoise
来调整和原始音频的区别程度。
通过这样的流程,可以实现对音乐的重新编辑,来达到你想要的效果。
下载 Json 格式工作流文件
下载下面的音频作为输入音频下载示例音频文件用于输入
Load Checkpoints
节点加载了 ace_step_v1_3.5b.safetensors
模型LoadAudio
节点中上传提供的音频文件TextEncodeAceStepAudio
的 tags
和 lyrics
中输入对应的音乐风格歌词等,提供歌词对于音频编辑来说非常重要Ksampler
节点的 denoise
参数,来调整采样过程中添加的噪声来调整与原始音频的相似程度,(越小与原始音频越相似,如果设置为 1.00
则可以近似认为没有音频输入)Run
按钮,或者使用快捷键 Ctrl(cmd) + Enter(回车)
来执行音频的生成。Save Audio
节点中查看生成的音频,你可以点击播放试听,对应的音频也会被保存至 ComfyUI/output/audio
(由Save Audio
节点决定子目录名称)。TextEncodeAceStepAudio
的 tags
中示例工作流中,将原本男声的 tags
修改为 female voice
来生成女声的音频TextEncodeAceStepAudio
的 lyrics
中示例工作流中,中对原本的歌词进行了调整修改,具体编辑你可以参考 ACE-Step 项目页面中的示例来了解如何完成修改tags
一个是 lyrics
。
tags
: 主要用来描述音乐的风格、场景等, 和我们平常其它生成的 prompt 类似,主要描述音频整体的风格和要求,使用英文逗号分隔lyrics
: 主要用来描述歌词,支持歌词结构标签,如 [verse](主歌)、[chorus](副歌)和 [bridge](过渡段)来区分歌词的不同部分,也可以在纯音乐情况下输入乐器名称tags
和 lyrics
在 ACE-Step 模型主页 中可以找到丰富的示例,你可以参考对应示例来尝试对应的提示词,本文档的提示词指南基于项目做了一些整理,以便让你能够快速尝试组合,来达到最想要的效果
lyrics
开头输入对应语言代码的缩写,比如中文[zh]
韩语 [ko]
等