跳转到主要内容

Documentation Index

Fetch the complete documentation index at: https://docs.comfy.org/llms.txt

Use this file to discover all available pages before exploring further.

本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑

SAM3 检测节点

概述

SAM3 检测节点使用文本描述、边界框或点提示执行开放词汇检测和分割。它可以根据您在文本中描述的内容、绘制框的位置或点击点的位置来识别和分割图像中的对象。

输入

参数数据类型是否必需范围描述
modelMODEL-用于检测和分割的 SAM3 模型
图像IMAGE-要处理的输入图像
条件CONDITIONING-来自 CLIPTextEncode 的文本条件。使用文本提示进行检测时需要
边界框BOUNDING_BOX-要分割的边界框。可以是单个框(应用于所有帧)、框列表(应用于所有帧)或列表的列表(逐帧框)。当未提供文本条件时,节点在每个框内进行分割
正向坐标STRING-正点提示,JSON 格式 [{"x": int, "y": int}, ...],使用像素坐标。这些是您希望包含在分割中的点
负向坐标STRING-负点提示,JSON 格式 [{"x": int, "y": int}, ...],使用像素坐标。这些是您希望从分割中排除的点
阈值FLOAT0.0 到 1.0基于文本检测的置信度阈值。仅保留得分高于此值的检测结果(默认值:0.5)
细化迭代次数INT0 到 5SAM 解码器优化迭代次数。较高的值可以改善遮罩质量。设置为 0 以使用原始检测器遮罩而不进行优化(默认值:2)
单独 maskBOOLEANTrue/False启用后,为每个检测到的对象输出单独的遮罩,而不是将它们合并为单个遮罩(默认值:False)

参数约束和说明

  • 文本提示:要使用基于文本的检测,您必须提供 conditioning 输入。当提供文本条件时,节点在图像上运行文本引导的检测。
  • 框提示:当提供 bboxes 但未提供文本条件时,节点在每个边界框内进行分割。
  • 点提示:当提供 positive_coordsnegative_coords 时,节点使用基于点的分割。点会自动缩放到模型的内部分辨率。
  • 多种提示类型:您可以组合不同的提示类型。例如,您可以同时提供文本条件和边界框,以将文本检测限制在特定区域。
  • 批量处理:节点支持批量图像。处理多个帧时,可以使用列表的列表格式为每个帧提供边界框。
  • 点的 JSON 格式:点坐标必须作为有效的 JSON 字符串提供,格式为 [{"x": 100, "y": 200}, {"x": 150, "y": 250}]

输出

输出名称数据类型描述
边界框MASK分割遮罩。当 单独 mask 为 False(默认值)时,返回每个帧的单个合并遮罩。当为 True 时,返回每个检测到的对象的单独遮罩
边界框BOUNDING_BOX检测到的边界框,包含坐标和置信度得分。每个框包括 xywidthheightscore

Source fingerprint (SHA-256): d073bda7eca934f3c64e1be740f5fb5249d27046a8be5902ea5d2245d5f679ea