> ## Documentation Index
> Fetch the complete documentation index at: https://docs.comfy.org/llms.txt
> Use this file to discover all available pages before exploring further.

# Stable Audio 1.0 ComfyUI ワークフロー例

> Stability AI のオープンソースモデル Stable Audio 1.0 を ComfyUI で使用してテキストから音声を生成する方法を解説します。

<Tip>
  <Tabs>
    <Tab title="ポータブル版または自宅サーバーで実行しているユーザー">
      ComfyUI が最新版に更新されていることを確認してください。

      * [ComfyUI のダウンロード](https://www.comfy.org/download)
      * [更新手順](/ja/installation/update_comfyui)

      このガイドで紹介するワークフローは、[ワークフローテンプレート](/ja/interface/features/template)から入手できます。\
      テンプレート内に該当のワークフローが見つからない場合、ComfyUI のバージョンが古くなっている可能性があります。（デスクトップ版の更新は若干遅れることがあります）

      ワークフローを読み込んだ際にノードが欠落している場合の主な原因：

      1. 最新の ComfyUI（Nightly 版）を使用していない
      2. 起動時に一部のノードのインポートに失敗している
    </Tab>

    <Tab title="デスクトップ版またはクラウド版ユーザー">
      * デスクトップ版は ComfyUI の安定版（Stable Release）をベースとしており、新しいデスクトップ安定版がリリースされると自動的に更新されます。
      * [Cloud](https://cloud.comfy.org) は、ComfyUI の安定版リリース後に更新されます。

      したがって、このドキュメントで記載されているコアノードのうち、一部が利用できない場合は、そのノード機能がまだ最新の安定版に含まれていないためです。次回の安定版リリースをお待ちください。
    </Tab>
  </Tabs>
</Tip>

**Stable Audio 1.0** は、Stability AI 初のオープンソース音声生成モデルです。テキストプロンプトを受け取り、音声クリップを生成します。ComfyUI では標準のテキストから音声パイプラインとして動作します：CLIP がプロンプトをエンコードし、KSampler が潜在空間をノイズ除去し、VAE が音声にデコードします。

**関連リンク**：

* [GitHub: Stability-AI/stable-audio-open-1.0](https://github.com/Stability-AI/stable-audio-open-1.0)

## ワークフロー

<Card title="ワークフローをダウンロード" icon="download" href="https://github.com/Comfy-Org/workflow_templates/blob/main/templates/audio_stable_audio_example.json">
  JSON をダウンロードするか、テンプレートライブラリで"Stable Audio 1.0"を検索
</Card>

<Card title="Comfy Cloud で実行" icon="cloud" href="https://cloud.comfy.org/?template=audio_stable_audio_example&utm_source=docs&utm_medium=referral&utm_campaign=stable-audio-1">
  Comfy Cloud で開く
</Card>

![Stable Audio 1.0 ワークフロー](https://raw.githubusercontent.com/Comfy-Org/workflow_templates/main/templates/audio_stable_audio_example-1.webp)

**標準の ComfyUI ノード**のみを使用し、カスタムノードは不要です。Stable Audio 1.0 チェックポイントを読み込み、CLIP テキストエンコーダーでプロンプトをエンコードし、KSampler で潜在空間をノイズ除去し、VAE で音声にデコードします。

**使用方法**：

1. **モデルを読み込む** — `CheckpointLoaderSimple` ノードで `stable-audio-open-1.0.safetensors` を使用
2. **プロンプトを書く** — `CLIPTextEncode` ノードに説明を入力（例："heaven church electronic dance music"）
3. **再生時間を設定** — `EmptyLatentAudio` ノードの長さを調整（デフォルト 47.6 秒）
4. **実行**（`Ctrl/Cmd + Enter`）をクリックして生成。音声は `ComfyUI/output/audio/` に保存されます

## モデルダウンロード

ワークフローを読み込むと、モデルがない場合に ComfyUI がダウンロードリンクを提示します。手動で設定する場合、以下のファイルをダウンロードして適切なフォルダに配置してください。

### チェックポイント

<Card title="stable-audio-open-1.0.safetensors" icon="download" href="https://huggingface.co/StabilityAI/stable-audio-open-1.0/resolve/main/stable-audio-open-1.0.safetensors">
  2.3GB。models/checkpoints/ に配置
</Card>

以下のように配置します：

```
📂 ComfyUI/
├── 📂 models/
│   └── 📂 checkpoints/
│       └── stable-audio-open-1.0.safetensors
```

### テキストエンコーダー

<Card title="t5-base.safetensors" icon="download" href="https://huggingface.co/Comfy-Org/t5-base/resolve/main/t5-base.safetensors">
  プロンプト処理用テキストエンコーダー。models/text\_encoders/ に配置
</Card>

以下のように配置します：

```
📂 ComfyUI/
├── 📂 models/
│   └── 📂 text_encoders/
│       └── t5-base.safetensors
```

配置後、ComfyUI で **R** キーを押してノード定義をリフレッシュすると、最新のモデルが利用可能になります。
