SAM3_Detect - ComfyUI Built-in Node Documentation - ComfyUI

概述

SAM3 检测节点使用文本描述、边界框或点提示执行开放词汇检测和分割。它可以根据您在文本中描述的内容、绘制框的位置或点击点的位置来识别和分割图像中的对象。

输入

参数	描述	数据类型	是否必需	范围
`model`	用于检测和分割的 SAM3 模型	MODEL	是	-
`图像`	要处理的输入图像	IMAGE	是	-
`条件`	来自 CLIPTextEncode 的文本条件。使用文本提示进行检测时需要	CONDITIONING	否	-
`边界框`	要分割的边界框。可以是单个框（应用于所有帧）、框列表（应用于所有帧）或列表的列表（逐帧框）。当未提供文本条件时，节点在每个框内进行分割	BOUNDING_BOX	否	-
`正向坐标`	正点提示，JSON 格式 `[{"x": int, "y": int}, ...]`，使用像素坐标。这些是您希望包含在分割中的点	STRING	否	-
`负向坐标`	负点提示，JSON 格式 `[{"x": int, "y": int}, ...]`，使用像素坐标。这些是您希望从分割中排除的点	STRING	否	-
`阈值`	基于文本检测的置信度阈值。仅保留得分高于此值的检测结果（默认值：0.5）	FLOAT	否	0.0 到 1.0
`细化迭代次数`	SAM 解码器优化迭代次数。较高的值可以改善遮罩质量。设置为 0 以使用原始检测器遮罩而不进行优化（默认值：2）	INT	否	0 到 5
`单独 mask`	启用后，为每个检测到的对象输出单独的遮罩，而不是将它们合并为单个遮罩（默认值：False）	BOOLEAN	否	True/False

参数约束和说明

文本提示：要使用基于文本的检测，您必须提供 conditioning 输入。当提供文本条件时，节点在图像上运行文本引导的检测。
框提示：当提供 bboxes 但未提供文本条件时，节点在每个边界框内进行分割。
点提示：当提供 positive_coords 或 negative_coords 时，节点使用基于点的分割。点会自动缩放到模型的内部分辨率。
多种提示类型：您可以组合不同的提示类型。例如，您可以同时提供文本条件和边界框，以将文本检测限制在特定区域。
批量处理：节点支持批量图像。处理多个帧时，可以使用列表的列表格式为每个帧提供边界框。
点的 JSON 格式：点坐标必须作为有效的 JSON 字符串提供，格式为 [{"x": 100, "y": 200}, {"x": 150, "y": 250}]。

输出

输出名称	描述	数据类型
`mask`	分割遮罩。当 `单独 mask` 为 False（默认值）时，返回每个帧的单个合并遮罩。当为 True 时，返回每个检测到的对象的单独遮罩	MASK
`边界框`	检测到的边界框，包含坐标和置信度得分。每个框包括 `x`、`y`、`width`、`height` 和 `score` 值	BOUNDING_BOX

本文档由 AI 生成。如果您发现任何错误或有改进建议，欢迎贡献！在 GitHub 上编辑

Source fingerprint (SHA-256): d073bda7eca934f3c64e1be740f5fb5249d27046a8be5902ea5d2245d5f679ea

RTDETR_detect - ComfyUI Built-in Node Documentation

SAM3_TrackPreview - ComfyUI Built-in Node Documentation