SAM3_Detect - ComfyUI Built-in Node Documentation

개요

SAM3 Detect 노드는 텍스트 설명, 경계 상자 또는 포인트 프롬프트를 사용하여 개방형 어휘 탐지 및 분할을 수행합니다. 텍스트로 설명하는 내용, 상자를 그리는 위치, 또는 포인트를 클릭하는 위치에 따라 이미지에서 객체를 식별하고 분할할 수 있습니다.

매개변수	설명	데이터 타입	필수	범위
`model`	탐지 및 분할에 사용할 SAM3 모델	MODEL	예	-
`image`	처리할 입력 이미지	IMAGE	예	-
`conditioning`	CLIPTextEncode의 텍스트 컨디셔닝. 텍스트 프롬프트를 사용한 탐지 시 필수	CONDITIONING	아니요	-
`bboxes`	분할할 경계 상자. 단일 상자(모든 프레임에 적용), 상자 목록(모든 프레임에 적용), 또는 목록의 목록(프레임별 상자)으로 제공 가능. 텍스트 컨디셔닝 없이 제공 시 각 상자 내부를 분할	BOUNDING_BOX	아니요	-
`positive_coords`	JSON 형식의 양성 포인트 프롬프트 `[{"x": int, "y": int}, ...]` (픽셀 좌표 사용). 분할에 포함하려는 포인트	STRING	아니요	-
`negative_coords`	JSON 형식의 음성 포인트 프롬프트 `[{"x": int, "y": int}, ...]` (픽셀 좌표 사용). 분할에서 제외하려는 포인트	STRING	아니요	-
`threshold`	텍스트 기반 탐지의 신뢰도 임계값. 이 값 이상의 점수를 가진 탐지만 유지 (기본값: 0.5)	FLOAT	아니요	0.0 ~ 1.0
`refine_iterations`	SAM 디코더 정제 반복 횟수. 높은 값은 마스크 품질을 향상시킬 수 있음. 정제 없이 원시 탐지기 마스크를 사용하려면 0으로 설정 (기본값: 2)	INT	아니요	0 ~ 5
`individual_masks`	활성화 시 감지된 각 객체에 대해 개별 마스크를 출력하며, 단일 마스크로 결합하지 않음 (기본값: False)	BOOLEAN	아니요	True/False

텍스트 프롬프트: 텍스트 기반 탐지를 사용하려면 conditioning 입력을 제공해야 합니다. 텍스트 컨디셔닝이 제공되면 노드는 이미지에서 텍스트 기반 탐지를 실행합니다.
상자 프롬프트: 텍스트 컨디셔닝 없이 bboxes가 제공되면 노드는 각 경계 상자 내부 영역을 분할합니다.
포인트 프롬프트: positive_coords 또는 negative_coords가 제공되면 노드는 포인트 기반 분할을 사용합니다. 포인트는 모델의 내부 해상도로 자동 조정됩니다.
여러 프롬프트 유형: 다양한 프롬프트 유형을 결합할 수 있습니다. 예를 들어, 텍스트 탐지를 특정 영역으로 제한하기 위해 텍스트 컨디셔닝과 경계 상자를 함께 제공할 수 있습니다.
배치 처리: 노드는 배치 이미지를 지원합니다. 여러 프레임을 처리할 때 목록의 목록 형식을 사용하여 프레임별로 경계 상자를 제공할 수 있습니다.
포인트의 JSON 형식: 포인트 좌표는 [{"x": 100, "y": 200}, {"x": 150, "y": 250}] 형식의 유효한 JSON 문자열로 제공되어야 합니다.

출력 이름	설명	데이터 타입
`masks`	분할 마스크. `individual_masks`가 False(기본값)인 경우 프레임당 단일 결합 마스크를 반환합니다. True인 경우 감지된 각 객체에 대한 개별 마스크를 반환합니다	MASK
`bboxes`	좌표와 신뢰도 점수가 포함된 감지된 경계 상자. 각 상자에는 `x`, `y`, `width`, `height` 및 `score` 값이 포함됩니다	BOUNDING_BOX

이 문서는 AI에 의해 생성되었습니다. 오류를 발견하거나 개선 제안이 있으시면 기여해 주세요! GitHub에서 편집

Source fingerprint (SHA-256): d073bda7eca934f3c64e1be740f5fb5249d27046a8be5902ea5d2245d5f679ea