> ## Documentation Index
> Fetch the complete documentation index at: https://docs.comfy.org/llms.txt
> Use this file to discover all available pages before exploring further.

# Stable Audio 3 ComfyUI 워크플로우 예시

> Qwen 프롬프트 확장 및 카테고리 인식 리프롬프팅을 활용해 ComfyUI에서 Stability AI의 오픈소스 Stable Audio 3 모델을 사용하여 텍스트를 오디오로 변환하는 가이드입니다.

<Tip>
  <Tabs>
    <Tab title="휴대용 또는 자체 배포 사용자">
      ComfyUI가 최신 버전으로 업데이트되었는지 확인하세요.

      * [ComfyUI 다운로드](https://www.comfy.org/download)
      * [업데이트 가이드](/ko/installation/update_comfyui)

      이 가이드의 워크플로우는 [워크플로우 템플릿](/ko/interface/features/template)에서 확인할 수 있습니다.
      템플릿에서 찾을 수 없다면, 귀하의 ComfyUI가 오래된 버전일 수 있습니다. (데스크톱 버전의 업데이트는 다소 지연될 수 있습니다)

      워크플로우를 로드할 때 노드가 누락되는 경우, 가능한 원인:

      1. 최신 ComfyUI 버전(야간 빌드)을 사용하고 있지 않음
      2. 일부 노드가 시작 시 가져오기에 실패함
    </Tab>

    <Tab title="데스크톱 또는 클라우드 사용자">
      * 데스크톱 버전은 ComfyUI 안정판 기반으로, 새로운 데스크톱 안정판이 출시되면 자동으로 업데이트됩니다.
      * [클라우드](https://cloud.comfy.org)는 ComfyUI 안정판 출시 후 업데이트됩니다.

      따라서 이 문서에서 핵심 노드가 누락된 것을 발견했다면, 그 이유는 새로운 핵심 노드가 아직 최신 안정판에 공개되지 않았기 때문일 수 있습니다. 다음 안정판 출시를 기다려 주세요.
    </Tab>
  </Tabs>
</Tip>

**Stable Audio 3** ([GitHub](https://github.com/Stability-AI/stable-audio-3))는 Stability AI가 개발한 최신 오픈소스 음성 생성 모델로, 완전히 라이선스된 음악 데이터로 학습되었으며 상업적 사용이 허가되었습니다. 이 모델은 전용 서브그래프 노드를 사용해 텍스트 설명을 바탕으로 고품질 스테레오 오디오—음악, 효과음, 악기 등—를 생성하며, 선택적으로 Qwen 기반의 카테고리 인식 리프롬프팅을 제공합니다.

Stable Audio 3는 세 가지 변형으로 제공됩니다:

* **Small-SFX** — 사운드 효과와 짧은 분위기, 최대 2분 길이. CPU에서도 실행 가능한 작은 크기입니다.
* **Small-Music** — 짧은 음악 루프, 디바이스에 친화적, 최대 2분 길이.
* **Medium** — 더 긴 트랙으로 강력한 구조와 음악성을 갖추었으며, 최대 약 6분 20초 길이입니다. GPU가 필요합니다.

**관련 링크**:

* [GitHub: Stability-AI/stable-audio-3](https://github.com/Stability-AI/stable-audio-3)
* [Hugging Face (Comfy-Org/stable-audio-3)](https://huggingface.co/Comfy-Org/stable-audio-3)
* [블로그: 발표](https://blog.comfy.org/p/stable-audio-3-day-0-support)

## 이용 가능한 워크플로우

### Stable Audio 3 Medium

<Card title="워크플로우 다운로드" icon="download" href="https://github.com/Comfy-Org/workflow_templates/blob/main/templates/audio_stable_audio_3_medium.json">
  JSON 파일을 다운로드하거나 템플릿 라이브러리에서 "Stable Audio 3 Medium" 검색
</Card>

<Card title="Comfy Cloud에서 실행" icon="cloud" href="https://cloud.comfy.org/?template=audio_stable_audio_3_medium&utm_source=docs&utm_medium=referral&utm_campaign=stable-audio-3">
  Comfy Cloud에서 열기
</Card>

![Stable Audio 3 Medium 워크플로우](https://raw.githubusercontent.com/Comfy-Org/workflow_templates/main/templates/audio_stable_audio_3_medium-1.webp)

**Stable Audio 3 Medium** 워크플로우는 완벽한 기능을 갖춘 텍스트를 오디오로 변환하는 파이프라인입니다. 짧은 텍스트 아이디어, 선택적 지속 시간, 시드값, 카테고리를 제공하면, 워크플로우는 Qwen을 사용해 **카테고리 인식 리프롬프트 템플릿**으로 프롬프트를 확장한 후 Stable Audio 3 체크포인트를 통해 스테레오 오디오를 생성합니다.

**사용 방법**:

1. **텍스트 아이디어** — 원하는 사운드, 음악 또는 효과에 대한 간략한 설명을 입력하세요 (예: "강렬한 베이스가 있는 활기찬 일렉트로닉 댄스 트랙")
2. **지속 시간** — 원하는 클립 길이를 초 단위로 설정하세요 (기본값은 다양함)
3. **시드** — 시드 값을 조정해 재현성을 제어하세요
4. **카테고리** — 리프롬프트 사전 설정을 선택하세요: **Music**, **Instrument**, **SFX**, 또는 **One-shot**
5. **리프롬프트 활성화** — `use_reprompt`을 켜서 Qwen이 짧은 아이디어를 자세한 프롬프트로 확장한 후 생성하도록 하세요
6. **실행** (`Ctrl/Cmd + Enter`)을 클릭해 생성하세요. 오디오는 `ComfyUI/output/audio/`에 저장됩니다.

### Stable Audio 3 Medium Base

<Card title="워크플로우 다운로드" icon="download" href="https://github.com/Comfy-Org/workflow_templates/blob/main/templates/audio_stable_audio_3_medium_base.json">
  JSON 파일을 다운로드하거나 템플릿 라이브러리에서 "Stable Audio 3 Medium Base" 검색
</Card>

<Card title="Comfy Cloud에서 실행" icon="cloud" href="https://cloud.comfy.org/?template=audio_stable_audio_3_medium_base&utm_source=docs&utm_medium=referral&utm_campaign=stable-audio-3">
  Comfy Cloud에서 열기
</Card>

![Stable Audio 3 Medium Base 워크플로우](https://raw.githubusercontent.com/Comfy-Org/workflow_templates/main/templates/audio_stable_audio_3_medium_base-1.webp)

Qwen 리프롬프트 확장을 포함하지 않은 Stable Audio 3의 간소화된 버전입니다. 완전한 텍스트 프롬프트를 기대하고 바로 모델에 전달합니다. 이미 상세한 프롬프트를 가지고 있고 더 빠른 생성을 원할 때 사용하세요.

**사용 방법**:

1. **텍스트 프롬프트** — 원하는 오디오에 대한 상세한 설명을 입력하세요
2. **지속 시간** — 클립 길이를 초 단위로 설정하세요
3. **시드** — 재현성을 제어하세요
4. **실행** (`Ctrl/Cmd + Enter`)을 클릭해 생성하세요

## 모델 다운로드

워크플로우를 로드할 때 ComfyUI는 누락된 모델에 대한 다운로드 링크를 표시합니다. 수동으로 설정하려면 아래 파일을 다운로드해 올바른 폴더에 배치하세요.

### 체크포인트

<Card title="stable_audio_3_medium.safetensors" icon="download" href="https://huggingface.co/Comfy-Org/stable-audio-3/resolve/main/checkpoints/stable_audio_3_medium.safetensors">
  Medium 워크플로우용. models/checkpoints/에 배치하세요
</Card>

<Card title="stable_audio_3_medium_base.safetensors" icon="download" href="https://huggingface.co/Comfy-Org/stable-audio-3/resolve/main/checkpoints/stable_audio_3_medium_base.safetensors">
  Medium Base 워크플로우용. models/checkpoints/에 배치하세요
</Card>

체크포인트를 다음 위치에 배치하세요:

```
📂 ComfyUI/
├── 📂 models/
│   └── 📂 checkpoints/
│       ├── stable_audio_3_medium.safetensors
│       └── stable_audio_3_medium_base.safetensors
```

### 텍스트 인코더

<Card title="t5gemma_b_b_ul2.safetensors" icon="download" href="https://huggingface.co/Comfy-Org/stable-audio-3/resolve/main/text_encoders/t5gemma_b_b_ul2.safetensors">
  모든 Stable Audio 3 워크플로우에 필수. models/text\_encoders/에 배치하세요
</Card>

<Card title="qwen3.5_2b_bf16.safetensors" icon="download" href="https://huggingface.co/Comfy-Org/Qwen3.5/resolve/main/text_encoders/qwen3.5_2b_bf16.safetensors">
  Medium 워크플로우용 (Qwen 리프롬프트). models/text\_encoders/에 배치하세요
</Card>

텍스트 인코더를 다음 위치에 배치하세요:

```
📂 ComfyUI/
├── 📂 models/
│   └── 📂 text_encoders/
│       ├── t5gemma_b_b_ul2.safetensors
│       └── qwen3.5_2b_bf16.safetensors
```

파일을 배치한 후 ComfyUI에서 **R**을 눌러 노드를 새로고침하고 최신 모델을 로드하세요.
