Documentation Index
Fetch the complete documentation index at: https://docs.comfy.org/llms.txt
Use this file to discover all available pages before exploring further.
本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑
SAM3 检测节点
概述
SAM3 检测节点使用文本描述、边界框或点提示执行开放词汇检测和分割。它可以根据您在文本中描述的内容、绘制框的位置或点击点的位置来识别和分割图像中的对象。输入
| 参数 | 数据类型 | 是否必需 | 范围 | 描述 |
|---|---|---|---|---|
model | MODEL | 是 | - | 用于检测和分割的 SAM3 模型 |
图像 | IMAGE | 是 | - | 要处理的输入图像 |
条件 | CONDITIONING | 否 | - | 来自 CLIPTextEncode 的文本条件。使用文本提示进行检测时需要 |
边界框 | BOUNDING_BOX | 否 | - | 要分割的边界框。可以是单个框(应用于所有帧)、框列表(应用于所有帧)或列表的列表(逐帧框)。当未提供文本条件时,节点在每个框内进行分割 |
正向坐标 | STRING | 否 | - | 正点提示,JSON 格式 [{"x": int, "y": int}, ...],使用像素坐标。这些是您希望包含在分割中的点 |
负向坐标 | STRING | 否 | - | 负点提示,JSON 格式 [{"x": int, "y": int}, ...],使用像素坐标。这些是您希望从分割中排除的点 |
阈值 | FLOAT | 否 | 0.0 到 1.0 | 基于文本检测的置信度阈值。仅保留得分高于此值的检测结果(默认值:0.5) |
细化迭代次数 | INT | 否 | 0 到 5 | SAM 解码器优化迭代次数。较高的值可以改善遮罩质量。设置为 0 以使用原始检测器遮罩而不进行优化(默认值:2) |
单独 mask | BOOLEAN | 否 | True/False | 启用后,为每个检测到的对象输出单独的遮罩,而不是将它们合并为单个遮罩(默认值:False) |
参数约束和说明
- 文本提示:要使用基于文本的检测,您必须提供
conditioning输入。当提供文本条件时,节点在图像上运行文本引导的检测。 - 框提示:当提供
bboxes但未提供文本条件时,节点在每个边界框内进行分割。 - 点提示:当提供
positive_coords或negative_coords时,节点使用基于点的分割。点会自动缩放到模型的内部分辨率。 - 多种提示类型:您可以组合不同的提示类型。例如,您可以同时提供文本条件和边界框,以将文本检测限制在特定区域。
- 批量处理:节点支持批量图像。处理多个帧时,可以使用列表的列表格式为每个帧提供边界框。
- 点的 JSON 格式:点坐标必须作为有效的 JSON 字符串提供,格式为
[{"x": 100, "y": 200}, {"x": 150, "y": 250}]。
输出
| 输出名称 | 数据类型 | 描述 |
|---|---|---|
边界框 | MASK | 分割遮罩。当 单独 mask 为 False(默认值)时,返回每个帧的单个合并遮罩。当为 True 时,返回每个检测到的对象的单独遮罩 |
边界框 | BOUNDING_BOX | 检测到的边界框,包含坐标和置信度得分。每个框包括 x、y、width、height 和 score 值 |
Source fingerprint (SHA-256):
d073bda7eca934f3c64e1be740f5fb5249d27046a8be5902ea5d2245d5f679ea