Stability AI Stable Audio 2.5 파트너 노드 ComfyUI 공식 워크플로우 예시

Stability AI Stable Audio 2.5 파트너 노드를 사용하면 Stability AI의 최신 음성 생성 모델을 활용해 텍스트 프롬프트, 오디오 변환 및 오디오 인페인팅 기능을 통해 고품질 음악을 만들 수 있습니다. Stable Audio 2.5는 기업용으로 설계되었으며, 개선된 음악 구조와 더 나은 프롬프트 적합성, 그리고 몇 초 만에 몇 분 길이의 작곡을 생성할 수 있는 기능을 갖추고 있습니다. 이 모델은 세 가지 주요 워크플로우를 제공합니다: 설명을 통해 음악을 생성하는 텍스트-to-오디오, 기존 오디오를 새로운 곡으로 변환하는 오디오-to-오디오, 그리고 기존 트랙을 완성하거나 연장하는 오디오 인페인팅입니다. Stable Audio 2.5는 라이선스된 오디오로만 훈련되어 상업적으로 안전하며, 전문적인 품질의 음성 생성과 기업급 신뢰성을 필요로 하는 광고주, 게임 스튜디오 및 콘텐츠 제작자에게 완벽한 선택입니다.

파트너 노드를 사용하려면 올바르게 로그인되어 있고 허가된 네트워크 환경을 사용하고 있는지 확인해야 합니다. 파트너 노드를 사용하기 위한 구체적인 요구사항은 문서의 파트너 노드 개요 섹션을 참조해 주세요.

휴대용 또는 자체 배포 사용자
데스크톱 또는 클라우드 사용자

ComfyUI가 최신 버전으로 업데이트되었는지 확인하세요.

이 가이드의 워크플로우는 워크플로우 템플릿에서 확인할 수 있습니다. 템플릿에서 찾을 수 없다면, 귀하의 ComfyUI가 오래된 버전일 수 있습니다. (데스크톱 버전의 업데이트는 다소 지연될 수 있습니다)워크플로우를 로드할 때 노드가 누락되는 경우, 가능한 원인:

최신 ComfyUI 버전(야간 빌드)을 사용하고 있지 않음
일부 노드가 시작 시 가져오기에 실패함

텍스트-to-오디오 워크플로우

텍스트-to-오디오를 위해서는 텍스트 프롬프트를 통해 오디오를 생성할 수 있습니다. 생성하고자 하는 음악을 설명해야 합니다.

JSON 워크플로우 다운로드

텍스트 프롬프트를 수정하세요. 생성하고자 하는 음악을 설명하기 위해 키워드를 사용해야 합니다.
(선택사항) duration 매개변수를 수정하세요. 기본값은 190입니다.
Run 버튼을 클릭하거나 단축키 Ctrl(cmd) + Enter를 사용해 오디오 생성을 실행하세요. 오디오는 ComfyUI/output/audio 디렉터리에 저장됩니다.

오디오-to-오디오 워크플로우

오디오-to-오디오 작업은 기본적으로 음악 재샘플링입니다. 주어진 음악에서 새로운 음악을 생성하거나, 멜로디를 흥얼거리기만 해도 모델이 입력된 오디오를 기반으로 새로운 음악을 생성할 수 있습니다.

JSON 워크플로우 다운로드

입력 오디오 다운로드

이 워크플로우에서는 편집하고자 하는 오디오(최소 6초 이상)를 입력할 수 있도록 두 개의 노드를 제공했습니다:
- 1.1 Record Audio 노드: 흥얼거리는 멜로디 등 어떤 음악 아이디어든 녹음할 수 있습니다. 최소 6초 이상이어야 합니다.
- 1.2 LoadAudio 노드: 이 워크플로우에 사용하고자 하는 오디오를 업로드할 수 있습니다.
텍스트 프롬프트를 수정하세요. 생성하고자 하는 음악을 설명하기 위해 키워드를 사용해야 합니다.
strength 매개변수는 원본 오디오와의 차이를 조절하는 데 사용됩니다. 값이 낮을수록 생성된 오디오는 원본 오디오와 더 유사해집니다.
Run 버튼을 클릭하거나 단축키 Ctrl(cmd) + Enter를 사용해 오디오 생성을 실행하세요. 오디오는 ComfyUI/output/audio 디렉터리에 저장됩니다.

오디오 인페인팅 워크플로우

오디오 인페인팅은 기존 트랙을 완성하거나 연장하는 데 사용됩니다. 음악의 빠진 부분을 완성하거나 음악을 더 길게 확장할 수 있습니다. 인페인팅을 시작하고 끝내고자 하는 위치를 설정해야 합니다.

JSON 워크플로우 다운로드

입력 오디오 다운로드

LoadAudio 노드에 오디오를 업로드하세요.
텍스트 프롬프트를 수정하세요. 생성하고자 하는 음악을 설명하기 위해 키워드를 사용해야 합니다.
(선택사항) duration 매개변수를 수정하세요. 기본값은 190입니다.
(중요) mask_start 및 mask_end 매개변수를 수정하세요. 인페인팅을 시작하고 끝내고자 하는 위치를 설정해야 합니다.
Run 버튼을 클릭하거나 단축키 Ctrl(cmd) + Enter를 사용해 오디오 생성을 실행하세요. 오디오는 ComfyUI/output/audio 디렉터리에 저장됩니다.

​텍스트-to-오디오 워크플로우

​오디오-to-오디오 워크플로우

​오디오 인페인팅 워크플로우

텍스트-to-오디오 워크플로우

오디오-to-오디오 워크플로우

오디오 인페인팅 워크플로우