메인 콘텐츠로 건너뛰기
ComfyUI가 최신 버전으로 업데이트되었는지 확인하세요.이 가이드의 워크플로우는 워크플로우 템플릿에서 확인할 수 있습니다. 템플릿에서 찾을 수 없다면, 귀하의 ComfyUI가 오래된 버전일 수 있습니다. (데스크톱 버전의 업데이트는 다소 지연될 수 있습니다)워크플로우를 로드할 때 노드가 누락되는 경우, 가능한 원인:
  1. 최신 ComfyUI 버전(야간 빌드)을 사용하고 있지 않음
  2. 일부 노드가 시작 시 가져오기에 실패함
VOID(비디오 객체 인페인팅 및 삭제)는 Netflix가 오픈소스로 공개한 강력한 비디오 인페인팅 모델입니다. 이 모델은 CogVideoX를 기반으로 한 2회 통과 확산 파이프라인을 사용해 비디오에서 객체를 제거하고, 생성된 빈 공간을 시간적으로 일관성 있는 콘텐츠로 채웁니다. VOID는 객체와 함께 그 객체가 장면에 유발하는 모든 상호작용까지 제거합니다. 그림자나 반사 같은 부차적 효과뿐만 아니라, 사람이 사라지면서 물체가 떨어지는 것과 같은 물리적 상호작용도 제거합니다. 예를 들어, 기타를 들고 있는 사람이 제거되면 VOID는 기타에 미치는 사람의 영향까지 제거해 자연스럽게 기타가 떨어지도록 합니다. VOID는 ComfyUI에서 기본적으로 지원되며(PR #13403), 전체 모델 가중치는 Apache 2.0 라이선스 하에 제공됩니다. VOID 모델 - GitHub | 논문(arXiv) | 🤗 Diffusers 파이프라인
(왼쪽) — 스노보더가 포함된 원본 영상. (오른쪽) — 스노보더를 제거한 후 처리된 결과입니다. VOID는 원치 않는 객체를 제거하면서 프레임 간 자연스러운 움직임, 조명, 장면의 일관성을 유지합니다.

주요 강점

  • 상호작용 인식 제거 — 객체뿐 아니라 장면에 유발한 모든 물리적 상호작용(그림자, 반사, 떨어지는 물체)까지 제거합니다.
  • 객체 제거, 단일 프레임 패치가 아님 — 클립 전체에 걸쳐 일관된 움직임과 조명을 생성합니다.
  • 2회 통과 정밀화 — 2회 통과는 1회 통과보다 우수한 시간적 안정성을 제공하며, 특히 긴 컷이나 질감이 있는 배경에서 더욱 효과적입니다.
한계: 불분명한 마스크, 혼란스러운 움직임, 또는 프레임을 지배하는 대상은 여전히 최적의 결과를 내지 못할 수 있습니다—세그먼테이션 자체가 잘못된 경우 이를 고칠 수는 없습니다.

VOID 비디오 인페인팅 워크플로우

1. 워크플로우 다운로드

ComfyUI를 최신 버전으로 업데이트한 후, 워크플로우 -> 템플릿 둘러보기로 이동해 유틸리티 카테고리에서 “VOID: 비디오 인페인팅”을 찾으세요.

JSON 워크플로우 파일 다운로드

워크플로우 다운로드

Comfy Cloud에서 실행

클라우드에서 열기

2. 모델 다운로드

모델은 모두 Comfy-Org VOID 모델 저장소에 호스팅됩니다. 확산 모델 — 핵심 2회 통과 인페인팅 모델: VAE: 광학 흐름: SAM3 체크포인트 — 세그먼테이션용: 텍스트 인코더:
📂 ComfyUI/
├── 📂 models/
│   ├── 📂 checkpoints/
│   │   └── sam3.1_multiplex_fp16.safetensors
│   ├── 📂 text_encoders/
│   │   └── t5xxl_fp16.safetensors
│   ├── 📂 vae/
│   │   └── cogvideox_vae.safetensors
│   ├── 📂 optical_flow/
│   │   └── raft_large_C_T_SKHT_V2-ff5fadd5.safetensors
│   └── 📂 diffusion_models/
│       ├── void_pass2.safetensors
│       └── void_pass1.safetensors

3. 워크플로우 사용하기

입력:
  • 소스 비디오비디오 로드 노드를 통해 비디오를 로드하세요(ComfyUI의 input/ 폴더에 넣으세요)
  • 양성 프롬프트(인페인팅 채우기) — 제거된 이후의 장면을 설명하세요. 무엇이 제거되었는지가 아니라 남아있는 부분과 그 모습에 집중하세요.
    • 예시: empty kitchen counter, daylight, tiles visible
  • 음성 프롬프트 — 선택적 아티팩트 방지 목록; 비워둘 수도 있습니다
  • SAM3 객체 프롬프트 — 마스크할 무엇인지에 대한 짧은 레이블입니다. SAM3는 의미적 이해를 통해 대상 객체의 세그멘테이션 마스크를 생성합니다.
    • 예시: person in blue jacket, red cup on table
    • SAM3 프롬프트의 최대 토큰 수는 32입니다. 여러 대상을 별도로 프롬프트하려면 쉼표로 구분하고, 각 프롬프트당 감지되는 최대 객체 수를 지정하려면 :N을 사용하세요: eye:2, window panels:4
모드:
프롬프트역할
SAM3 객체무엇을 제거할지 (SAM3는 의미적 세그멘테이션을 통해 마스크를 생성합니다)
양성(인페인팅)시간에 걸쳐 빈 공간을 어떻게 채울지
시간적 안정성이 중요한 긴 클립이나 질감이 있는 배경에서는 2회 통과(정밀화 통과)를 사용하세요. 1회 통과만으로도 빠르지만, 더 많은 떨림이 나타날 수 있습니다.

서브그래프 알아보기

이 워크플로우는 서브그래프 노드를 사용해 모듈식 비디오 처리를 수행합니다. 서브그래프 문서를 확인해 워크플로우를 맞춤화하고 확장하는 방법을 알아보세요.

추가 참고사항

  • 마스크 품질이 중요합니다 — 대상 객체 주변에 깔끔하고 딱 맞는 마스크를 사용하면 최상의 결과를 얻을 수 있습니다.
  • 프롬프트 작성 팁 — 제거된 이후의 장면이 자연스럽게 보이는 모습을 묘사하세요. 제거 자체가 아니라요.
  • 음성 프롬프트 사용은 반복적인 결함(워터마크, 흐릿함, 과다한 팔다리)이 보일 때만 사용하세요.
  • 2회 통과 워크플로우 — 템플릿은 1회 통과 후 자동으로 2회 통과를 실행합니다; 테스트 중 더 빠른 반복을 위해 1회 통과만 실행할 수도 있습니다.