> ## Documentation Index
> Fetch the complete documentation index at: https://docs.comfy.org/llms.txt
> Use this file to discover all available pages before exploring further.

# Stable Audio 3 ComfyUI ワークフロー例

> Stability AI のオープンソースモデル Stable Audio 3 を ComfyUI で使用し、Qwen によるプロンプト拡張とカテゴリ認識リプロンプト機能を活用したテキストから音声生成を行う方法を解説します。

<Tip>
  <Tabs>
    <Tab title="ポータブル版または自宅サーバーで実行しているユーザー">
      ComfyUI が最新版に更新されていることを確認してください。

      * [ComfyUI のダウンロード](https://www.comfy.org/download)
      * [更新手順](/ja/installation/update_comfyui)

      このガイドで紹介するワークフローは、[ワークフローテンプレート](/ja/interface/features/template)から入手できます。\
      テンプレート内に該当のワークフローが見つからない場合、ComfyUI のバージョンが古くなっている可能性があります。（デスクトップ版の更新は若干遅れることがあります）

      ワークフローを読み込んだ際にノードが欠落している場合の主な原因：

      1. 最新の ComfyUI（Nightly 版）を使用していない
      2. 起動時に一部のノードのインポートに失敗している
    </Tab>

    <Tab title="デスクトップ版またはクラウド版ユーザー">
      * デスクトップ版は ComfyUI の安定版（Stable Release）をベースとしており、新しいデスクトップ安定版がリリースされると自動的に更新されます。
      * [Cloud](https://cloud.comfy.org) は、ComfyUI の安定版リリース後に更新されます。

      したがって、このドキュメントで記載されているコアノードのうち、一部が利用できない場合は、そのノード機能がまだ最新の安定版に含まれていないためです。次回の安定版リリースをお待ちください。
    </Tab>
  </Tabs>
</Tip>

**Stable Audio 3** ([GitHub](https://github.com/Stability-AI/stable-audio-3)) は、Stability AI が提供する最新のオープンソース音声生成モデルです。完全にライセンスされた音楽データで学習され、商用利用が可能です。専用サブグラフノードを使用してテキスト記述から高品質なステレオ音声（音楽、効果音、楽器音など）を生成し、オプションで Qwen によるカテゴリ認識リプロンプトを利用できます。

Stable Audio 3 には3つのバリエーションがあります：

* **Small-SFX** — 効果音や短いアンビエンス、最大2分。CPUでも動作可能な小型モデル。
* **Small-Music** — 短い音楽ループ、デバイス上での使用に最適、最大2分。
* **Medium** — より長い楽曲、構造と音楽性に優れ、最大約6分20秒。GPUが必要。

**関連リンク**：

* [GitHub: Stability-AI/stable-audio-3](https://github.com/Stability-AI/stable-audio-3)
* [Hugging Face (Comfy-Org/stable-audio-3)](https://huggingface.co/Comfy-Org/stable-audio-3)
* [ブログ：リリース告知](https://blog.comfy.org/p/stable-audio-3-day-0-support)

## 利用可能なワークフロー

### Stable Audio 3 Medium

<Card title="ワークフローをダウンロード" icon="download" href="https://github.com/Comfy-Org/workflow_templates/blob/main/templates/audio_stable_audio_3_medium.json">
  JSON をダウンロードするか、テンプレートライブラリで"Stable Audio 3 Medium"を検索
</Card>

<Card title="Comfy Cloud で実行" icon="cloud" href="https://cloud.comfy.org/?template=audio_stable_audio_3_medium&utm_source=docs&utm_medium=referral&utm_campaign=stable-audio-3">
  Comfy Cloud で開く
</Card>

![Stable Audio 3 Medium ワークフロー](https://raw.githubusercontent.com/Comfy-Org/workflow_templates/main/templates/audio_stable_audio_3_medium-1.webp)

**Stable Audio 3 Medium** ワークフローは、完全なテキストから音声生成パイプラインです。短いテキストアイデア、任意の再生時間、シード、カテゴリを入力すると、Qwen を使用したカテゴリ認識リプロンプトテンプレートでプロンプトを拡張し、Stable Audio 3 チェックポイントでステレオ音声を生成します。

**使用方法**：

1. **テキストアイデア** — 生成したい音声の簡単な説明を入力（例：「重いベースのアップテンポなエレクトロニックダンスミュージック」）
2. **再生時間** — クリップの長さ（秒）を設定
3. **シード** — 再現性を制御
4. **カテゴリ** — リプロンプトプリセットを選択：**Music**（音楽）、**Instrument**（楽器）、**SFX**（効果音）、**One-shot**（単発音）
5. **リプロンプトを有効化** — `use_reprompt` をオンにして Qwen が短いアイデアを詳細なプロンプトに拡張
6. **実行**（`Ctrl/Cmd + Enter`）をクリックして生成。音声は `ComfyUI/output/audio/` に保存されます

### Stable Audio 3 Medium Base

<Card title="ワークフローをダウンロード" icon="download" href="https://github.com/Comfy-Org/workflow_templates/blob/main/templates/audio_stable_audio_3_medium_base.json">
  JSON をダウンロードするか、テンプレートライブラリで"Stable Audio 3 Medium Base"を検索
</Card>

<Card title="Comfy Cloud で実行" icon="cloud" href="https://cloud.comfy.org/?template=audio_stable_audio_3_medium_base&utm_source=docs&utm_medium=referral&utm_campaign=stable-audio-3">
  Comfy Cloud で開く
</Card>

![Stable Audio 3 Medium Base ワークフロー](https://raw.githubusercontent.com/Comfy-Org/workflow_templates/main/templates/audio_stable_audio_3_medium_base-1.webp)

Qwen リプロンプト機能を省いたシンプルなバージョン。完全なテキストプロンプトを直接 Stable Audio 3 モデルに渡します。すでに詳細なプロンプトがある場合や、高速に生成したい場合に使用します。

**使用方法**：

1. **テキストプロンプト** — 生成したい音声の詳細な説明を入力
2. **再生時間** — クリップの長さ（秒）を設定
3. **シード** — 再現性を制御
4. **実行**（`Ctrl/Cmd + Enter`）をクリックして生成

## モデルダウンロード

ワークフローを読み込むと、モデルがない場合に ComfyUI がダウンロードリンクを提示します。手動で設定する場合、以下のファイルをダウンロードして適切なフォルダに配置してください。

### チェックポイント

<Card title="stable_audio_3_medium.safetensors" icon="download" href="https://huggingface.co/Comfy-Org/stable-audio-3/resolve/main/checkpoints/stable_audio_3_medium.safetensors">
  Medium ワークフロー用。models/checkpoints/ に配置
</Card>

<Card title="stable_audio_3_medium_base.safetensors" icon="download" href="https://huggingface.co/Comfy-Org/stable-audio-3/resolve/main/checkpoints/stable_audio_3_medium_base.safetensors">
  Medium Base ワークフロー用。models/checkpoints/ に配置
</Card>

以下のように配置します：

```
📂 ComfyUI/
├── 📂 models/
│   └── 📂 checkpoints/
│       ├── stable_audio_3_medium.safetensors
│       └── stable_audio_3_medium_base.safetensors
```

### テキストエンコーダー

<Card title="t5gemma_b_b_ul2.safetensors" icon="download" href="https://huggingface.co/Comfy-Org/stable-audio-3/resolve/main/text_encoders/t5gemma_b_b_ul2.safetensors">
  すべての Stable Audio 3 ワークフローで必要。models/text\_encoders/ に配置
</Card>

<Card title="qwen3.5_2b_bf16.safetensors" icon="download" href="https://huggingface.co/Comfy-Org/Qwen3.5/resolve/main/text_encoders/qwen3.5_2b_bf16.safetensors">
  Medium ワークフローで必要（Qwen リプロンプト）。models/text\_encoders/ に配置
</Card>

以下のように配置します：

```
📂 ComfyUI/
├── 📂 models/
│   └── 📂 text_encoders/
│       ├── t5gemma_b_b_ul2.safetensors
│       └── qwen3.5_2b_bf16.safetensors
```

配置後、ComfyUI で **R** キーを押してノード定義をリフレッシュすると、最新のモデルが利用可能になります。
