Stable Audio 3 ComfyUI 워크플로우 예시

휴대용 또는 자체 배포 사용자
데스크톱 또는 클라우드 사용자

ComfyUI가 최신 버전으로 업데이트되었는지 확인하세요.

이 가이드의 워크플로우는 워크플로우 템플릿에서 확인할 수 있습니다. 템플릿에서 찾을 수 없다면, 귀하의 ComfyUI가 오래된 버전일 수 있습니다. (데스크톱 버전의 업데이트는 다소 지연될 수 있습니다)워크플로우를 로드할 때 노드가 누락되는 경우, 가능한 원인:

최신 ComfyUI 버전(야간 빌드)을 사용하고 있지 않음
일부 노드가 시작 시 가져오기에 실패함

Stable Audio 3 (GitHub)는 Stability AI가 개발한 최신 오픈소스 음성 생성 모델로, 완전히 라이선스된 음악 데이터로 학습되었으며 상업적 사용이 허가되었습니다. 이 모델은 전용 서브그래프 노드를 사용해 텍스트 설명을 바탕으로 고품질 스테레오 오디오—음악, 효과음, 악기 등—를 생성하며, 선택적으로 Qwen 기반의 카테고리 인식 리프롬프팅을 제공합니다. Stable Audio 3는 세 가지 변형으로 제공됩니다:

Small-SFX — 사운드 효과와 짧은 분위기, 최대 2분 길이. CPU에서도 실행 가능한 작은 크기입니다.
Small-Music — 짧은 음악 루프, 디바이스에 친화적, 최대 2분 길이.
Medium — 더 긴 트랙으로 강력한 구조와 음악성을 갖추었으며, 최대 약 6분 20초 길이입니다. GPU가 필요합니다.

관련 링크:

이용 가능한 워크플로우

Stable Audio 3 Medium

워크플로우 다운로드

JSON 파일을 다운로드하거나 템플릿 라이브러리에서 “Stable Audio 3 Medium” 검색

Comfy Cloud에서 실행

Comfy Cloud에서 열기

Stable Audio 3 Medium 워크플로우는 완벽한 기능을 갖춘 텍스트를 오디오로 변환하는 파이프라인입니다. 짧은 텍스트 아이디어, 선택적 지속 시간, 시드값, 카테고리를 제공하면, 워크플로우는 Qwen을 사용해 카테고리 인식 리프롬프트 템플릿으로 프롬프트를 확장한 후 Stable Audio 3 체크포인트를 통해 스테레오 오디오를 생성합니다. 사용 방법:

텍스트 아이디어 — 원하는 사운드, 음악 또는 효과에 대한 간략한 설명을 입력하세요 (예: “강렬한 베이스가 있는 활기찬 일렉트로닉 댄스 트랙”)
지속 시간 — 원하는 클립 길이를 초 단위로 설정하세요 (기본값은 다양함)
시드 — 시드 값을 조정해 재현성을 제어하세요
카테고리 — 리프롬프트 사전 설정을 선택하세요: Music, Instrument, SFX, 또는 One-shot
리프롬프트 활성화 — use_reprompt을 켜서 Qwen이 짧은 아이디어를 자세한 프롬프트로 확장한 후 생성하도록 하세요
실행 (Ctrl/Cmd + Enter)을 클릭해 생성하세요. 오디오는 ComfyUI/output/audio/에 저장됩니다.

Stable Audio 3 Medium Base

워크플로우 다운로드

JSON 파일을 다운로드하거나 템플릿 라이브러리에서 “Stable Audio 3 Medium Base” 검색

Comfy Cloud에서 실행

Comfy Cloud에서 열기

Qwen 리프롬프트 확장을 포함하지 않은 Stable Audio 3의 간소화된 버전입니다. 완전한 텍스트 프롬프트를 기대하고 바로 모델에 전달합니다. 이미 상세한 프롬프트를 가지고 있고 더 빠른 생성을 원할 때 사용하세요. 사용 방법:

텍스트 프롬프트 — 원하는 오디오에 대한 상세한 설명을 입력하세요
지속 시간 — 클립 길이를 초 단위로 설정하세요
시드 — 재현성을 제어하세요
실행 (Ctrl/Cmd + Enter)을 클릭해 생성하세요

모델 다운로드

워크플로우를 로드할 때 ComfyUI는 누락된 모델에 대한 다운로드 링크를 표시합니다. 수동으로 설정하려면 아래 파일을 다운로드해 올바른 폴더에 배치하세요.

체크포인트

stable_audio_3_medium.safetensors

Medium 워크플로우용. models/checkpoints/에 배치하세요

stable_audio_3_medium_base.safetensors

Medium Base 워크플로우용. models/checkpoints/에 배치하세요

체크포인트를 다음 위치에 배치하세요:

📂 ComfyUI/
├── 📂 models/
│   └── 📂 checkpoints/
│       ├── stable_audio_3_medium.safetensors
│       └── stable_audio_3_medium_base.safetensors

텍스트 인코더

t5gemma_b_b_ul2.safetensors

모든 Stable Audio 3 워크플로우에 필수. models/text_encoders/에 배치하세요

qwen3.5_2b_bf16.safetensors

Medium 워크플로우용 (Qwen 리프롬프트). models/text_encoders/에 배치하세요

텍스트 인코더를 다음 위치에 배치하세요:

📂 ComfyUI/
├── 📂 models/
│   └── 📂 text_encoders/
│       ├── t5gemma_b_b_ul2.safetensors
│       └── qwen3.5_2b_bf16.safetensors

파일을 배치한 후 ComfyUI에서 R을 눌러 노드를 새로고침하고 최신 모델을 로드하세요.

시작하기

Agent Tools / MCP

기본 개념

인터페이스 가이드

튜토리얼

파트너 노드

Stable Audio 3 ComfyUI 워크플로우 예시

이용 가능한 워크플로우

Stable Audio 3 Medium

워크플로우 다운로드

Comfy Cloud에서 실행

Stable Audio 3 Medium Base

워크플로우 다운로드

Comfy Cloud에서 실행

모델 다운로드

체크포인트

stable_audio_3_medium.safetensors

stable_audio_3_medium_base.safetensors

텍스트 인코더

t5gemma_b_b_ul2.safetensors

qwen3.5_2b_bf16.safetensors

​이용 가능한 워크플로우

​Stable Audio 3 Medium

워크플로우 다운로드

Comfy Cloud에서 실행

​Stable Audio 3 Medium Base

워크플로우 다운로드

Comfy Cloud에서 실행

​모델 다운로드

​체크포인트

stable_audio_3_medium.safetensors

stable_audio_3_medium_base.safetensors

​텍스트 인코더

t5gemma_b_b_ul2.safetensors

qwen3.5_2b_bf16.safetensors

이용 가능한 워크플로우

Stable Audio 3 Medium

Stable Audio 3 Medium Base

모델 다운로드

체크포인트

텍스트 인코더