- Small-SFX — 사운드 효과와 짧은 분위기, 최대 2분 길이. CPU에서도 실행 가능한 작은 크기입니다.
- Small-Music — 짧은 음악 루프, 디바이스에 친화적, 최대 2분 길이.
- Medium — 더 긴 트랙으로 강력한 구조와 음악성을 갖추었으며, 최대 약 6분 20초 길이입니다. GPU가 필요합니다.
이용 가능한 워크플로우
Stable Audio 3 Medium
워크플로우 다운로드
JSON 파일을 다운로드하거나 템플릿 라이브러리에서 “Stable Audio 3 Medium” 검색
Comfy Cloud에서 실행
Comfy Cloud에서 열기
Stable Audio 3 Medium 워크플로우는 완벽한 기능을 갖춘 텍스트를 오디오로 변환하는 파이프라인입니다. 짧은 텍스트 아이디어, 선택적 지속 시간, 시드값, 카테고리를 제공하면, 워크플로우는 Qwen을 사용해 카테고리 인식 리프롬프트 템플릿으로 프롬프트를 확장한 후 Stable Audio 3 체크포인트를 통해 스테레오 오디오를 생성합니다.
사용 방법:
- 텍스트 아이디어 — 원하는 사운드, 음악 또는 효과에 대한 간략한 설명을 입력하세요 (예: “강렬한 베이스가 있는 활기찬 일렉트로닉 댄스 트랙”)
- 지속 시간 — 원하는 클립 길이를 초 단위로 설정하세요 (기본값은 다양함)
- 시드 — 시드 값을 조정해 재현성을 제어하세요
- 카테고리 — 리프롬프트 사전 설정을 선택하세요: Music, Instrument, SFX, 또는 One-shot
- 리프롬프트 활성화 —
use_reprompt을 켜서 Qwen이 짧은 아이디어를 자세한 프롬프트로 확장한 후 생성하도록 하세요 - 실행 (
Ctrl/Cmd + Enter)을 클릭해 생성하세요. 오디오는ComfyUI/output/audio/에 저장됩니다.
Stable Audio 3 Medium Base
워크플로우 다운로드
JSON 파일을 다운로드하거나 템플릿 라이브러리에서 “Stable Audio 3 Medium Base” 검색
Comfy Cloud에서 실행
Comfy Cloud에서 열기
Qwen 리프롬프트 확장을 포함하지 않은 Stable Audio 3의 간소화된 버전입니다. 완전한 텍스트 프롬프트를 기대하고 바로 모델에 전달합니다. 이미 상세한 프롬프트를 가지고 있고 더 빠른 생성을 원할 때 사용하세요.
사용 방법:
- 텍스트 프롬프트 — 원하는 오디오에 대한 상세한 설명을 입력하세요
- 지속 시간 — 클립 길이를 초 단위로 설정하세요
- 시드 — 재현성을 제어하세요
- 실행 (
Ctrl/Cmd + Enter)을 클릭해 생성하세요
모델 다운로드
워크플로우를 로드할 때 ComfyUI는 누락된 모델에 대한 다운로드 링크를 표시합니다. 수동으로 설정하려면 아래 파일을 다운로드해 올바른 폴더에 배치하세요.체크포인트
stable_audio_3_medium.safetensors
Medium 워크플로우용. models/checkpoints/에 배치하세요
stable_audio_3_medium_base.safetensors
Medium Base 워크플로우용. models/checkpoints/에 배치하세요
텍스트 인코더
t5gemma_b_b_ul2.safetensors
모든 Stable Audio 3 워크플로우에 필수. models/text_encoders/에 배치하세요
qwen3.5_2b_bf16.safetensors
Medium 워크플로우용 (Qwen 리프롬프트). models/text_encoders/에 배치하세요