메인 콘텐츠로 건너뛰기
ComfyUI가 최신 버전으로 업데이트되었는지 확인하세요.이 가이드의 워크플로우는 워크플로우 템플릿에서 확인할 수 있습니다. 템플릿에서 찾을 수 없다면, 귀하의 ComfyUI가 오래된 버전일 수 있습니다. (데스크톱 버전의 업데이트는 다소 지연될 수 있습니다)워크플로우를 로드할 때 노드가 누락되는 경우, 가능한 원인:
  1. 최신 ComfyUI 버전(야간 빌드)을 사용하고 있지 않음
  2. 일부 노드가 시작 시 가져오기에 실패함
Stable Audio 3 (GitHub)는 Stability AI가 개발한 최신 오픈소스 음성 생성 모델로, 완전히 라이선스된 음악 데이터로 학습되었으며 상업적 사용이 허가되었습니다. 이 모델은 전용 서브그래프 노드를 사용해 텍스트 설명을 바탕으로 고품질 스테레오 오디오—음악, 효과음, 악기 등—를 생성하며, 선택적으로 Qwen 기반의 카테고리 인식 리프롬프팅을 제공합니다. Stable Audio 3는 세 가지 변형으로 제공됩니다:
  • Small-SFX — 사운드 효과와 짧은 분위기, 최대 2분 길이. CPU에서도 실행 가능한 작은 크기입니다.
  • Small-Music — 짧은 음악 루프, 디바이스에 친화적, 최대 2분 길이.
  • Medium — 더 긴 트랙으로 강력한 구조와 음악성을 갖추었으며, 최대 약 6분 20초 길이입니다. GPU가 필요합니다.
관련 링크:

이용 가능한 워크플로우

Stable Audio 3 Medium

워크플로우 다운로드

JSON 파일을 다운로드하거나 템플릿 라이브러리에서 “Stable Audio 3 Medium” 검색

Comfy Cloud에서 실행

Comfy Cloud에서 열기
Stable Audio 3 Medium 워크플로우 Stable Audio 3 Medium 워크플로우는 완벽한 기능을 갖춘 텍스트를 오디오로 변환하는 파이프라인입니다. 짧은 텍스트 아이디어, 선택적 지속 시간, 시드값, 카테고리를 제공하면, 워크플로우는 Qwen을 사용해 카테고리 인식 리프롬프트 템플릿으로 프롬프트를 확장한 후 Stable Audio 3 체크포인트를 통해 스테레오 오디오를 생성합니다. 사용 방법:
  1. 텍스트 아이디어 — 원하는 사운드, 음악 또는 효과에 대한 간략한 설명을 입력하세요 (예: “강렬한 베이스가 있는 활기찬 일렉트로닉 댄스 트랙”)
  2. 지속 시간 — 원하는 클립 길이를 초 단위로 설정하세요 (기본값은 다양함)
  3. 시드 — 시드 값을 조정해 재현성을 제어하세요
  4. 카테고리 — 리프롬프트 사전 설정을 선택하세요: Music, Instrument, SFX, 또는 One-shot
  5. 리프롬프트 활성화use_reprompt을 켜서 Qwen이 짧은 아이디어를 자세한 프롬프트로 확장한 후 생성하도록 하세요
  6. 실행 (Ctrl/Cmd + Enter)을 클릭해 생성하세요. 오디오는 ComfyUI/output/audio/에 저장됩니다.

Stable Audio 3 Medium Base

워크플로우 다운로드

JSON 파일을 다운로드하거나 템플릿 라이브러리에서 “Stable Audio 3 Medium Base” 검색

Comfy Cloud에서 실행

Comfy Cloud에서 열기
Stable Audio 3 Medium Base 워크플로우 Qwen 리프롬프트 확장을 포함하지 않은 Stable Audio 3의 간소화된 버전입니다. 완전한 텍스트 프롬프트를 기대하고 바로 모델에 전달합니다. 이미 상세한 프롬프트를 가지고 있고 더 빠른 생성을 원할 때 사용하세요. 사용 방법:
  1. 텍스트 프롬프트 — 원하는 오디오에 대한 상세한 설명을 입력하세요
  2. 지속 시간 — 클립 길이를 초 단위로 설정하세요
  3. 시드 — 재현성을 제어하세요
  4. 실행 (Ctrl/Cmd + Enter)을 클릭해 생성하세요

모델 다운로드

워크플로우를 로드할 때 ComfyUI는 누락된 모델에 대한 다운로드 링크를 표시합니다. 수동으로 설정하려면 아래 파일을 다운로드해 올바른 폴더에 배치하세요.

체크포인트

stable_audio_3_medium.safetensors

Medium 워크플로우용. models/checkpoints/에 배치하세요

stable_audio_3_medium_base.safetensors

Medium Base 워크플로우용. models/checkpoints/에 배치하세요
체크포인트를 다음 위치에 배치하세요:
📂 ComfyUI/
├── 📂 models/
│   └── 📂 checkpoints/
│       ├── stable_audio_3_medium.safetensors
│       └── stable_audio_3_medium_base.safetensors

텍스트 인코더

t5gemma_b_b_ul2.safetensors

모든 Stable Audio 3 워크플로우에 필수. models/text_encoders/에 배치하세요

qwen3.5_2b_bf16.safetensors

Medium 워크플로우용 (Qwen 리프롬프트). models/text_encoders/에 배치하세요
텍스트 인코더를 다음 위치에 배치하세요:
📂 ComfyUI/
├── 📂 models/
│   └── 📂 text_encoders/
│       ├── t5gemma_b_b_ul2.safetensors
│       └── qwen3.5_2b_bf16.safetensors
파일을 배치한 후 ComfyUI에서 R을 눌러 노드를 새로고침하고 최신 모델을 로드하세요.