> ## Documentation Index > Fetch the complete documentation index at: https://docs.comfy.org/llms.txt > Use this file to discover all available pages before exploring further. # Stable Audio 3 ComfyUI 워크플로우 예시 > Qwen 프롬프트 확장 및 카테고리 인식 리프롬프팅을 활용해 ComfyUI에서 Stability AI의 오픈소스 Stable Audio 3 모델을 사용하여 텍스트를 오디오로 변환하는 가이드입니다. ComfyUI가 최신 버전으로 업데이트되었는지 확인하세요. * [ComfyUI 다운로드](https://www.comfy.org/download) * [업데이트 가이드](/ko/installation/update_comfyui) 이 가이드의 워크플로우는 [워크플로우 템플릿](/ko/interface/features/template)에서 확인할 수 있습니다. 템플릿에서 찾을 수 없다면, 귀하의 ComfyUI가 오래된 버전일 수 있습니다. (데스크톱 버전의 업데이트는 다소 지연될 수 있습니다) 워크플로우를 로드할 때 노드가 누락되는 경우, 가능한 원인: 1. 최신 ComfyUI 버전(야간 빌드)을 사용하고 있지 않음 2. 일부 노드가 시작 시 가져오기에 실패함 * 데스크톱 버전은 ComfyUI 안정판 기반으로, 새로운 데스크톱 안정판이 출시되면 자동으로 업데이트됩니다. * [클라우드](https://cloud.comfy.org)는 ComfyUI 안정판 출시 후 업데이트됩니다. 따라서 이 문서에서 핵심 노드가 누락된 것을 발견했다면, 그 이유는 새로운 핵심 노드가 아직 최신 안정판에 공개되지 않았기 때문일 수 있습니다. 다음 안정판 출시를 기다려 주세요. **Stable Audio 3** ([GitHub](https://github.com/Stability-AI/stable-audio-3))는 Stability AI가 개발한 최신 오픈소스 음성 생성 모델로, 완전히 라이선스된 음악 데이터로 학습되었으며 상업적 사용이 허가되었습니다. 이 모델은 전용 서브그래프 노드를 사용해 텍스트 설명을 바탕으로 고품질 스테레오 오디오—음악, 효과음, 악기 등—를 생성하며, 선택적으로 Qwen 기반의 카테고리 인식 리프롬프팅을 제공합니다. Stable Audio 3는 세 가지 변형으로 제공됩니다: * **Small-SFX** — 사운드 효과와 짧은 분위기, 최대 2분 길이. CPU에서도 실행 가능한 작은 크기입니다. * **Small-Music** — 짧은 음악 루프, 디바이스에 친화적, 최대 2분 길이. * **Medium** — 더 긴 트랙으로 강력한 구조와 음악성을 갖추었으며, 최대 약 6분 20초 길이입니다. GPU가 필요합니다. **관련 링크**: * [GitHub: Stability-AI/stable-audio-3](https://github.com/Stability-AI/stable-audio-3) * [Hugging Face (Comfy-Org/stable-audio-3)](https://huggingface.co/Comfy-Org/stable-audio-3) * [블로그: 발표](https://blog.comfy.org/p/stable-audio-3-day-0-support) ## 이용 가능한 워크플로우 ### Stable Audio 3 Medium JSON 파일을 다운로드하거나 템플릿 라이브러리에서 "Stable Audio 3 Medium" 검색 Comfy Cloud에서 열기 ![Stable Audio 3 Medium 워크플로우](https://raw.githubusercontent.com/Comfy-Org/workflow_templates/main/templates/audio_stable_audio_3_medium-1.webp) **Stable Audio 3 Medium** 워크플로우는 완벽한 기능을 갖춘 텍스트를 오디오로 변환하는 파이프라인입니다. 짧은 텍스트 아이디어, 선택적 지속 시간, 시드값, 카테고리를 제공하면, 워크플로우는 Qwen을 사용해 **카테고리 인식 리프롬프트 템플릿**으로 프롬프트를 확장한 후 Stable Audio 3 체크포인트를 통해 스테레오 오디오를 생성합니다. **사용 방법**: 1. **텍스트 아이디어** — 원하는 사운드, 음악 또는 효과에 대한 간략한 설명을 입력하세요 (예: "강렬한 베이스가 있는 활기찬 일렉트로닉 댄스 트랙") 2. **지속 시간** — 원하는 클립 길이를 초 단위로 설정하세요 (기본값은 다양함) 3. **시드** — 시드 값을 조정해 재현성을 제어하세요 4. **카테고리** — 리프롬프트 사전 설정을 선택하세요: **Music**, **Instrument**, **SFX**, 또는 **One-shot** 5. **리프롬프트 활성화** — `use_reprompt`을 켜서 Qwen이 짧은 아이디어를 자세한 프롬프트로 확장한 후 생성하도록 하세요 6. **실행** (`Ctrl/Cmd + Enter`)을 클릭해 생성하세요. 오디오는 `ComfyUI/output/audio/`에 저장됩니다. ### Stable Audio 3 Medium Base JSON 파일을 다운로드하거나 템플릿 라이브러리에서 "Stable Audio 3 Medium Base" 검색 Comfy Cloud에서 열기 ![Stable Audio 3 Medium Base 워크플로우](https://raw.githubusercontent.com/Comfy-Org/workflow_templates/main/templates/audio_stable_audio_3_medium_base-1.webp) Qwen 리프롬프트 확장을 포함하지 않은 Stable Audio 3의 간소화된 버전입니다. 완전한 텍스트 프롬프트를 기대하고 바로 모델에 전달합니다. 이미 상세한 프롬프트를 가지고 있고 더 빠른 생성을 원할 때 사용하세요. **사용 방법**: 1. **텍스트 프롬프트** — 원하는 오디오에 대한 상세한 설명을 입력하세요 2. **지속 시간** — 클립 길이를 초 단위로 설정하세요 3. **시드** — 재현성을 제어하세요 4. **실행** (`Ctrl/Cmd + Enter`)을 클릭해 생성하세요 ## 모델 다운로드 워크플로우를 로드할 때 ComfyUI는 누락된 모델에 대한 다운로드 링크를 표시합니다. 수동으로 설정하려면 아래 파일을 다운로드해 올바른 폴더에 배치하세요. ### 체크포인트 Medium 워크플로우용. models/checkpoints/에 배치하세요 Medium Base 워크플로우용. models/checkpoints/에 배치하세요 체크포인트를 다음 위치에 배치하세요: ``` 📂 ComfyUI/ ├── 📂 models/ │ └── 📂 checkpoints/ │ ├── stable_audio_3_medium.safetensors │ └── stable_audio_3_medium_base.safetensors ``` ### 텍스트 인코더 모든 Stable Audio 3 워크플로우에 필수. models/text\_encoders/에 배치하세요 Medium 워크플로우용 (Qwen 리프롬프트). models/text\_encoders/에 배치하세요 텍스트 인코더를 다음 위치에 배치하세요: ``` 📂 ComfyUI/ ├── 📂 models/ │ └── 📂 text_encoders/ │ ├── t5gemma_b_b_ul2.safetensors │ └── qwen3.5_2b_bf16.safetensors ``` 파일을 배치한 후 ComfyUI에서 **R**을 눌러 노드를 새로고침하고 최신 모델을 로드하세요.