메인 콘텐츠로 건너뛰기
SCAIL-2는 Wan2.1 기반의 엔드투엔드 캐릭터 애니메이션 모델로, 구동 비디오의 움직임을 참조 캐릭터 이미지에 적용하여 캐릭터 애니메이션(캐릭터가 동작을 수행하도록 함)과 비디오 내 캐릭터 교체(추적된 인물을 참조 캐릭터로 대체)를 모두 가능하게 합니다. 주요 기능:
  • 엔드투엔드 캐릭터 애니메이션: 구동 비디오의 움직임으로 정적 캐릭터 이미지 구동
  • 두 가지 모드: 애니메이션 모드(캐릭터가 동작 수행)와 교체 모드(추적된 인물을 참조 캐릭터로 대체)
  • 긴 비디오 지원: 청크 기반 중첩 프레임 확장 생성
  • 내장 ComfyUI 노드: 네이티브 WanSCAILToVideo, SCAIL2ColoredMask, SAM3 트래킹 사용. 표준 모델 다운로드 외에 사용자 정의 노드 불필요
관련 링크:

SCAIL-2 캐릭터 교체 워크플로우

Comfy Cloud에서 실행

Comfy Cloud에서 열기

워크플로우 다운로드

JSON 다운로드 또는 템플릿 라이브러리에서 “SCAIL-2” 검색
ComfyUI가 최신 버전으로 업데이트되었는지 확인하세요.이 가이드의 워크플로우는 워크플로우 템플릿에서 확인할 수 있습니다. 템플릿에서 찾을 수 없다면, 귀하의 ComfyUI가 오래된 버전일 수 있습니다. (데스크톱 버전의 업데이트는 다소 지연될 수 있습니다)워크플로우를 로드할 때 노드가 누락되는 경우, 가능한 원인:
  1. 최신 ComfyUI 버전(야간 빌드)을 사용하고 있지 않음
  2. 일부 노드가 시작 시 가져오기에 실패함

워크플로우 작동 방식

이 워크플로우는 Base 서브그래프(첫 번째 세그먼트)와 Extend 서브그래프(이후 세그먼트)의 두 서브그래프 노드를 사용하여 짧은 비디오와 긴 비디오 모두에서 캐릭터 애니메이션을 지원합니다.
  1. 구동 비디오(pose_video)와 참조 캐릭터 이미지 로드
  2. Base 서브그래프가 첫 번째 세그먼트(기본 81프레임) 처리
  3. Extend 서브그래프가 두 번째 이상의 세그먼트를 처리하며, 이전 세그먼트의 previous_frames 연결
  4. 결과 미리보기 및 저장

서브그래프 알아보기

이 워크플로우는 모듈식 처리를 위해 Subgraph 노드를 사용합니다. 서브그래프 문서에서 워크플로우를 사용자 정의하고 확장하는 방법을 알아보세요.

긴 비디오

긴 비디오의 경우 세그먼트 수를 계산합니다: ceil(total_frames / 76). 첫 번째 세그먼트를 제외한 모든 세그먼트는 Extend 서브그래프를 사용합니다. 더 많은 세그먼트를 추가하려면 Extend 노드를 복제하고 previous_frames 출력을 연결한 다음 segment_index를 증가시킵니다.
참고: WanSCAILToVideo는 모든 세그먼트를 자동으로 실행 대기열에 넣을 수 없습니다. 각 세그먼트를 수동으로 실행하세요.

두 가지 모드

모드replace_mode구동 비디오 마스크 배경설명
교체 모드true(기본값)흰색구동 비디오에서 추적된 인물을 참조 캐릭터로 교체
애니메이션 모드false검정색참조 캐릭터가 구동 모션을 수행
두 서브그래프 노드에서 replace_mode 파라미터를 설정하세요.

입력 및 파라미터

공통 파라미터 (Base & Extend)

파라미터설명
pose_video전송할 움직임이 포함된 구동 비디오
reference_image애니메이션이나 삽입할 캐릭터 이미지
prompt출력 비디오 설명
replace_modetrue = 교체 모드, false = 애니메이션 모드
segment_index첫 번째 청크는 1, 이후 청크는 2+. Pose offset = 76 × (index − 1)
width / height출력 해상도, 예: 896×512. 16으로 나누어 떨어져야 함
frame_count세그먼트당 프레임 수 (기본값: 81)
previous_frame_count세그먼트 간 중첩 프레임 수 (기본값: 5)
pose_strength / pose_start / pose_end포즈 조건화 강도와 타이밍

SAM3 트래킹 (두 입력)

samm_video_objectsam3_image_object 입력은 SCAIL-2 출력 프롬프트가 아닌 SAM3 마스크 트래킹을 제어합니다. 이들은 색상 마스크가 추적할 객체를 결정합니다:
입력대상출력
sam3_video_object구동 비디오pose_video_mask
sam3_image_object참조 이미지reference_image_mask
  • 개방형 어휘 텍스트 사용 (기본값: human)
  • 비디오와 참조 이미지에서 대상이 동일하면 같은 용어 사용
  • 비디오와 참조 이미지가 다른 초점을 요구하는 경우 (예: 붐비는 장면) 다른 용어 사용

모델 설치

내장 WanSCAILToVideo 및 SCAIL2ColoredMask 노드를 사용하려면 먼저 ComfyUI를 최신 버전으로 업데이트하세요.

필수 모델

diffusion_models text_encoders (하나 선택) clip_vision vae loras checkpoints

파일 저장 위치

ComfyUI/
├── models/
│   ├── diffusion_models/
│   │   └── wan2.1_14B_SCAIL_2_fp16.safetensors
│   ├── text_encoders/
│   │   └── umt5_xxl_fp8_e4m3fn_scaled.safetensors
│   ├── clip_vision/
│   │   └── clip_vision_h.safetensors
│   ├── vae/
│   │   └── Wan2_1_VAE_bf16.safetensors
│   ├── loras/
│   │   ├── lightx2v_I2V_14B_480p_cfg_step_distill_rank64_bf16.safetensors
│   │   └── wan2.1_SCAIL_2_DPO_lora_bf16.safetensors
│   └── checkpoints/
│       └── sam3.1_multiplex_fp16.safetensors