메인 콘텐츠로 건너뛰기

SAM3 Detect 노드

개요

SAM3 Detect 노드는 텍스트 설명, 경계 상자 또는 포인트 프롬프트를 사용하여 개방형 어휘 탐지 및 분할을 수행합니다. 텍스트로 설명하는 내용, 상자를 그리는 위치, 또는 포인트를 클릭하는 위치에 따라 이미지에서 객체를 식별하고 분할할 수 있습니다.

입력

매개변수설명데이터 타입필수범위
model탐지 및 분할에 사용할 SAM3 모델MODEL-
image처리할 입력 이미지IMAGE-
conditioningCLIPTextEncode의 텍스트 컨디셔닝. 텍스트 프롬프트를 사용한 탐지 시 필수CONDITIONING아니요-
bboxes분할할 경계 상자. 단일 상자(모든 프레임에 적용), 상자 목록(모든 프레임에 적용), 또는 목록의 목록(프레임별 상자)으로 제공 가능. 텍스트 컨디셔닝 없이 제공 시 각 상자 내부를 분할BOUNDING_BOX아니요-
positive_coordsJSON 형식의 양성 포인트 프롬프트 [{"x": int, "y": int}, ...] (픽셀 좌표 사용). 분할에 포함하려는 포인트STRING아니요-
negative_coordsJSON 형식의 음성 포인트 프롬프트 [{"x": int, "y": int}, ...] (픽셀 좌표 사용). 분할에서 제외하려는 포인트STRING아니요-
threshold텍스트 기반 탐지의 신뢰도 임계값. 이 값 이상의 점수를 가진 탐지만 유지 (기본값: 0.5)FLOAT아니요0.0 ~ 1.0
refine_iterationsSAM 디코더 정제 반복 횟수. 높은 값은 마스크 품질을 향상시킬 수 있음. 정제 없이 원시 탐지기 마스크를 사용하려면 0으로 설정 (기본값: 2)INT아니요0 ~ 5
individual_masks활성화 시 감지된 각 객체에 대해 개별 마스크를 출력하며, 단일 마스크로 결합하지 않음 (기본값: False)BOOLEAN아니요True/False

매개변수 제약 조건 및 참고 사항

  • 텍스트 프롬프트: 텍스트 기반 탐지를 사용하려면 conditioning 입력을 제공해야 합니다. 텍스트 컨디셔닝이 제공되면 노드는 이미지에서 텍스트 기반 탐지를 실행합니다.
  • 상자 프롬프트: 텍스트 컨디셔닝 없이 bboxes가 제공되면 노드는 각 경계 상자 내부 영역을 분할합니다.
  • 포인트 프롬프트: positive_coords 또는 negative_coords가 제공되면 노드는 포인트 기반 분할을 사용합니다. 포인트는 모델의 내부 해상도로 자동 조정됩니다.
  • 여러 프롬프트 유형: 다양한 프롬프트 유형을 결합할 수 있습니다. 예를 들어, 텍스트 탐지를 특정 영역으로 제한하기 위해 텍스트 컨디셔닝과 경계 상자를 함께 제공할 수 있습니다.
  • 배치 처리: 노드는 배치 이미지를 지원합니다. 여러 프레임을 처리할 때 목록의 목록 형식을 사용하여 프레임별로 경계 상자를 제공할 수 있습니다.
  • 포인트의 JSON 형식: 포인트 좌표는 [{"x": 100, "y": 200}, {"x": 150, "y": 250}] 형식의 유효한 JSON 문자열로 제공되어야 합니다.

출력

출력 이름설명데이터 타입
bboxes분할 마스크. individual_masks가 False(기본값)인 경우 프레임당 단일 결합 마스크를 반환합니다. True인 경우 감지된 각 객체에 대한 개별 마스크를 반환합니다MASK
bboxes좌표와 신뢰도 점수가 포함된 감지된 경계 상자. 각 상자에는 x, y, width, heightscore 값이 포함됩니다BOUNDING_BOX
이 문서는 AI에 의해 생성되었습니다. 오류를 발견하거나 개선 제안이 있으시면 기여해 주세요! GitHub에서 편집

Source fingerprint (SHA-256): d073bda7eca934f3c64e1be740f5fb5249d27046a8be5902ea5d2245d5f679ea