SAM3 Detect ノード
概要
SAM3 Detect ノードは、テキストによる説明、バウンディングボックス、またはポイントプロンプトを使用して、オープンボキャブラリーの検出とセグメンテーションを実行します。テキストで記述した内容、ボックスを描いた場所、またはポイントをクリックした位置に基づいて、画像内のオブジェクトを識別し、セグメント化することができます。入力
| パラメータ | 説明 | データ型 | 必須 | 範囲 |
|---|---|---|---|---|
model | 検出とセグメンテーションに使用するSAM3モデル | MODEL | はい | - |
image | 処理する入力画像 | IMAGE | はい | - |
conditioning | CLIPTextEncodeからのテキスト条件付け。テキストプロンプトを使用した検出時に必要です | CONDITIONING | いいえ | - |
bboxes | セグメント化する領域のバウンディングボックス。単一のボックス(全フレームに適用)、ボックスのリスト(全フレームに適用)、またはリストのリスト(フレームごとのボックス)を指定できます。テキスト条件付けなしで指定した場合、各ボックス内をセグメント化します | BOUNDING_BOX | いいえ | - |
positive_coords | ピクセル座標を使用したJSON形式 [{"x": int, "y": int}, ...] の正のポイントプロンプト。セグメンテーションに含めたいポイントです | STRING | いいえ | - |
negative_coords | ピクセル座標を使用したJSON形式 [{"x": int, "y": int}, ...] の負のポイントプロンプト。セグメンテーションから除外したいポイントです | STRING | いいえ | - |
threshold | テキストベース検出の信頼度しきい値。この値を超えるスコアの検出のみが保持されます(デフォルト: 0.5) | FLOAT | いいえ | 0.0 ~ 1.0 |
refine_iterations | SAMデコーダーのリファインメントパスの回数。値を大きくするとマスク品質が向上する可能性があります。0を設定すると、リファインメントなしで生の検出マスクを使用します(デフォルト: 2) | INT | いいえ | 0 ~ 5 |
individual_masks | 有効にすると、検出された各オブジェクトの個別のマスクを出力し、単一のマスクに結合しません(デフォルト: False) | BOOLEAN | いいえ | True/False |
パラメータの制約と注意事項
- テキストプロンプト: テキストベースの検出を使用するには、
conditioning入力を提供する必要があります。テキスト条件付けが提供されると、ノードは画像上でテキストガイドによる検出を実行します。 - ボックスプロンプト: テキスト条件付けなしで
bboxesが提供された場合、ノードは各バウンディングボックス内の領域をセグメント化します。 - ポイントプロンプト:
positive_coordsまたはnegative_coordsが提供された場合、ノードはポイントベースのセグメンテーションを使用します。ポイントは自動的にモデルの内部解像度にスケーリングされます。 - 複数のプロンプトタイプ: 異なるプロンプトタイプを組み合わせることができます。例えば、テキスト条件付けとバウンディングボックスの両方を提供して、テキスト検出を特定の領域に制限することができます。
- バッチ処理: このノードはバッチ処理された画像をサポートしています。複数のフレームを処理する場合、リストのリスト形式を使用してフレームごとにバウンディングボックスを提供できます。
- ポイントのJSON形式: ポイント座標は、
[{"x": 100, "y": 200}, {"x": 150, "y": 250}]の形式の有効なJSON文字列として提供する必要があります。
出力
| 出力名 | 説明 | データ型 |
|---|---|---|
bboxes | セグメンテーションマスク。individual_masks が False(デフォルト)の場合、フレームごとに単一の結合マスクを返します。True の場合、検出された各オブジェクトの個別のマスクを返します | MASK |
bboxes | 座標と信頼度スコアを含む検出されたバウンディングボックス。各ボックスには x、y、width、height、score の値が含まれます | BOUNDING_BOX |
このドキュメントは AI によって生成されました。エラーを見つけた場合や改善のご提案がある場合は、ぜひ貢献してください! GitHub で編集
Source fingerprint (SHA-256):
d073bda7eca934f3c64e1be740f5fb5249d27046a8be5902ea5d2245d5f679ea