メインコンテンツへスキップ

Documentation Index

Fetch the complete documentation index at: https://docs.comfy.org/llms.txt

Use this file to discover all available pages before exploring further.

Make sure your ComfyUI is updated.Workflows in this guide can be found in the Workflow Templates. If you can’t find them in the template, your ComfyUI may be outdated. (Desktop version’s update will delay sometime)If nodes are missing when loading a workflow, possible reasons:
  1. You are not using the latest ComfyUI version (Nightly version)
  2. Some nodes failed to import at startup
SAM 3(Segment Anything Model 3)は、Meta が開発した画像・動画向けの統一ファンデーションモデルで、テキストや視覚的プロンプト(ポイント、ボックス、マスク)を用いた検出、セグメンテーション、オブジェクトトラッキングを実現します。前世代の SAM 2 と比較して、短いテキストフレーズで指定したオープンボキャブラリー概念の全インスタンスを網羅的にセグメントできる点が特徴です。 SAM 3.1 Multiplex は最新のチェックポイントリリースで、共有メモリ方式によるマルチオブジェクトトラッキングを導入し、精度を維持しながら大幅な高速化を実現しました。 SAM 3.1 は ComfyUI でネイティブサポートされており(PR #13408)、モデルウェイトは SAM License のもとで提供されています。 SAM 3 GitHub | 論文 (arXiv) | 🤗 Model Hub SAM 3.1 はテキストプロンプトに基づいて動画フレーム全体でオブジェクトをセグメントおよびトラッキングします。上の例は、対象オブジェクトにマスクを適用したセグメンテーション出力を示しています。

主な強み

  • テキスト駆動のセグメンテーション — 自然言語でセグメント対象を指定。手動でのポイント/ボックス注釈は不要
  • 画像・動画両対応 — 単一画像のセグメンテーションから動画シーケンスのフレーム間トラッキングまで
  • マルチオブジェクト対応 — カンマ区切りのプロンプトで複数オブジェクトを同時にセグメント・トラッキング
  • オープンボキャブラリー — 従来手法よりもはるかに広範なオープンボキャブラリー概念を処理
制限事項: テキストプロンプトのトークン上限は 32 トークンです。最良の結果を得るには、プロンプトを短く具体的に保ってください。

SAM 3.1 セグメンテーションワークフロー

1. ワークフローをダウンロード

ComfyUI を最新バージョンにアップデートし、メニューから ワークフロー -> テンプレートを閲覧 に進み、Utility カテゴリから SAM 3.1 ワークフローを見つけてください。 動画セグメンテーション:

JSON ワークフローをダウンロード

動画ワークフローをダウンロード

Comfy Cloud で実行

Open in cloud
画像セグメンテーション:

JSON ワークフローをダウンロード

画像ワークフローをダウンロード

Comfy Cloud で実行

Open in cloud

2. モデルをダウンロード

SAM 3.1 モデルは Comfy-Org SAM 3.1 モデルリポジトリ でホストされています。 以下のディレクトリ構造に配置してください:
📂 ComfyUI/
└── 📂 models/
    └── 📂 checkpoints/
        └── sam3.1_multiplex_fp16.safetensors

3. ワークフローの使い方

画像セグメンテーション:
  • 画像Load Image ノードで画像を読み込み(ComfyUI の input/ フォルダに配置)
  • オブジェクトプロンプト — セグメント対象の短いテキスト説明(例:personcarcat
  • 出力は画像に適用されたマスクで、RGBA プレビューでセグメンテーション結果を確認
動画セグメンテーション:
  • 動画Load Video ノードで動画を読み込み
  • オブジェクトプロンプト — 画像と同じ、フレーム間でトラッキング・セグメントする対象の短いテキスト
  • 出力には各フレームのマスクとバウンディングボックスが含まれます
プロンプト形式:
プロンプト役割
SAM3 オブジェクトプロンプトセグメントする対象の短い説明。最大 32 トークン
複数の対象を個別にプロンプトするには、カンマで区切り、:N で各プロンプトの最大検出数を指定: eye:2, window panels:4

Subgraph について学ぶ

本ワークフローは Subgraph ノードを使用してモジュール化された処理を実現しています。Subgraph ドキュメントを参照してワークフローのカスタマイズと拡張方法を学んでください。

補足説明

  • プロンプトは短く具体的に — モデルにはプロンプトあたり 32 トークンの制限があります
  • マルチオブジェクト検出 — カンマで異なるオブジェクトタイプを区切り、:N でタイプごとの検出数を制限
  • セグメンテーションマスク — 出力マスクは他のワークフロー(修復、背景除去など)の入力として使用可能
  • 更新が必要 — SAM 3.1 を利用するには ComfyUI を最新バージョンにアップデートしてください