메인 콘텐츠로 건너뛰기
**ATI (Any Trajectory Instruction)**는 ByteDance 팀에서 제안한 제어 가능한 비디오 생성 프레임워크입니다. ATI는 Wan2.1을 기반으로 구현되었으며, 임의의 트래젝터리 명령어를 통해 비디오 내 객체, 국소 영역 및 카메라 모션을 통합적으로 제어할 수 있습니다. 프로젝트 URL: https://github.com/bytedance/ATI

주요 특징

  • 통합 모션 제어: 객체, 국소 영역, 카메라 움직임 등 여러 가지 모션 유형에 대한 트래젝터리 제어를 지원합니다.
  • 인터랙티브 트래젝터리 에디터: 사용자가 이미지 위에 자유롭게 모션 트래젝터리를 그려서 편집할 수 있는 시각적 도구입니다.
  • Wan2.1 호환: 공식 Wan2.1 구현을 기반으로 하며, 환경과 모델 구조와 호환됩니다.
  • 풍부한 시각화 도구: 입력 트래젝터리, 출력 비디오, 트래젝터리 오버레이의 시각화를 지원합니다.

WAN ATI 트래젝터리 제어 워크플로우 예시

ComfyUI가 최신 버전으로 업데이트되었는지 확인하세요.이 가이드의 워크플로우는 워크플로우 템플릿에서 확인할 수 있습니다. 템플릿에서 찾을 수 없다면, 귀하의 ComfyUI가 오래된 버전일 수 있습니다. (데스크톱 버전의 업데이트는 다소 지연될 수 있습니다)워크플로우를 로드할 때 노드가 누락되는 경우, 가능한 원인:
  1. 최신 ComfyUI 버전(야간 빌드)을 사용하고 있지 않음
  2. 일부 노드가 시작 시 가져오기에 실패함

1. 워크플로우 다운로드

아래 비디오를 다운로드한 후 ComfyUI로 드래그하여 해당 워크플로우를 로드하세요. 다음 이미지를 입력으로 사용하겠습니다: v2v-input

2. 모델 다운로드

워크플로우에서 모델 파일을 성공적으로 다운로드하지 못했다면, 아래 링크를 이용해 수동으로 다운로드해 보세요. 디퓨전 모델 VAE 텍스트 인코더
다음 모델 중 하나를 선택하세요:
clip_vision 파일 저장 위치
ComfyUI/
├───📂 models/
│   ├───📂 diffusion_models/
│   │   └───Wan2_1-I2V-ATI-14B_fp8_e4m3fn.safetensors
│   ├───📂 text_encoders/
│   │   └─── umt5_xxl_fp8_e4m3fn_scaled.safetensors # 또는 다른 버전
│   ├───📂 clip_vision/
│   │   └─── clip_vision_h.safetensors
│   └───📂 vae/
│       └── wan_2.1_vae.safetensors

3. 워크플로우를 단계별로 완료하세요

워크플로우 단계 다이어그램 이미지의 번호가 매겨진 단계를 따라 해당 워크플로우를 원활하게 실행하세요.
  1. Load Diffusion Model 노드가 Wan2_1-I2V-ATI-14B_fp8_e4m3fn.safetensors 모델을 로드했는지 확인하세요.
  2. Load CLIP 노드가 umt5_xxl_fp8_e4m3fn_scaled.safetensors 모델을 로드했는지 확인하세요.
  3. Load VAE 노드가 wan_2.1_vae.safetensors 모델을 로드했는지 확인하세요.
  4. Load CLIP Vision 노드가 clip_vision_h.safetensors 모델을 로드했는지 확인하세요.
  5. 제공된 입력 이미지를 Load Image 노드에 업로드하세요.
  6. 트래젝터리 편집: 현재 ComfyUI에는 해당하는 트래젝터리 에디터가 없으므로, 다음 링크를 이용해 트래젝터리 편집을 완료할 수 있습니다.
  7. 프롬프트(긍정 및 부정)를 수정해야 한다면, 번호 5CLIP Text Encoder 노드에서 변경하세요.
  8. Run 버튼을 클릭하거나 단축키 Ctrl(cmd) + Enter를 사용해 비디오 생성을 실행하세요.