Stable Audio 1.0 ComfyUI ワークフロー例

ローカルユーザー
クラウドユーザー

ComfyUI が最新版に更新されていることを確認してください。

このガイドで紹介するワークフローは、ワークフローテンプレートから入手できます。テンプレート内に該当のワークフローが見つからない場合、ComfyUI のバージョンが古くなっている可能性があります。ワークフローを読み込んだ際にノードが欠落している場合の主な原因：

最新の ComfyUI（Nightly 版）を使用していない
起動時に一部のノードのインポートに失敗している

Stable Audio 1.0 は、Stability AI 初のオープンソース音声生成モデルです。テキストプロンプトを受け取り、音声クリップを生成します。ComfyUI では標準のテキストから音声パイプラインとして動作します：CLIP がプロンプトをエンコードし、KSampler が潜在空間をノイズ除去し、VAE が音声にデコードします。 関連リンク：

GitHub: Stability-AI/stable-audio-open-1.0

ワークフロー

ワークフローをダウンロード

JSON をダウンロードするか、テンプレートライブラリで”Stable Audio 1.0”を検索

Comfy Cloud で実行

Comfy Cloud で開く

標準の ComfyUI ノードのみを使用し、カスタムノードは不要です。Stable Audio 1.0 チェックポイントを読み込み、CLIP テキストエンコーダーでプロンプトをエンコードし、KSampler で潜在空間をノイズ除去し、VAE で音声にデコードします。 使用方法：

モデルを読み込む — CheckpointLoaderSimple ノードで stable-audio-open-1.0.safetensors を使用
プロンプトを書く — CLIPTextEncode ノードに説明を入力（例：“heaven church electronic dance music”）
再生時間を設定 — EmptyLatentAudio ノードの長さを調整（デフォルト 47.6 秒）
実行（Ctrl/Cmd + Enter）をクリックして生成。音声は ComfyUI/output/audio/ に保存されます

モデルダウンロード

ワークフローを読み込むと、モデルがない場合に ComfyUI がダウンロードリンクを提示します。手動で設定する場合、以下のファイルをダウンロードして適切なフォルダに配置してください。

チェックポイント

stable-audio-open-1.0.safetensors

2.3GB。models/checkpoints/ に配置

以下のように配置します：

📂 ComfyUI/
├── 📂 models/
│   └── 📂 checkpoints/
│       └── stable-audio-open-1.0.safetensors

テキストエンコーダー

t5-base.safetensors

プロンプト処理用テキストエンコーダー。models/text_encoders/ に配置

以下のように配置します：

📂 ComfyUI/
├── 📂 models/
│   └── 📂 text_encoders/
│       └── t5-base.safetensors

配置後、ComfyUI で R キーを押してノード定義をリフレッシュすると、最新のモデルが利用可能になります。

はじめに

Agent Tools / MCP

基本概念

インターフェースガイド

チュートリアル

パートナーノード

Stable Audio 1.0 ComfyUI ワークフロー例

ワークフロー

ワークフローをダウンロード

Comfy Cloud で実行

モデルダウンロード

チェックポイント

stable-audio-open-1.0.safetensors

テキストエンコーダー

t5-base.safetensors

​ワークフロー

ワークフローをダウンロード

Comfy Cloud で実行

​モデルダウンロード

​チェックポイント

stable-audio-open-1.0.safetensors

​テキストエンコーダー

t5-base.safetensors

ワークフロー

モデルダウンロード

チェックポイント

テキストエンコーダー