메인 콘텐츠로 건너뛰기
Wan 2.2는 WAN AI가 출시한 차세대 멀티모달 생성 모델입니다. 이 모델은 혁신적인 MoE(전문가 혼합) 아키텍처를 채택했으며, 고노이즈 및 저노이즈 전문가 모델로 구성되어 있습니다. 노이즈 제거 단계에 따라 전문가 모델을 나눌 수 있어 더 높은 품질의 비디오 콘텐츠를 생성할 수 있습니다. Wan 2.2는 세 가지 핵심 기능을 갖추고 있습니다: 영화 수준의 미적 제어, 전문 영화 산업의 미적 기준을 깊이 통합해 조명, 색감, 구도 등 다차원적 시각적 제어를 지원합니다; 대규모 복합 동작, 다양한 복잡한 동작을 쉽게 복원하고 동작의 부드러움과 제어성을 강화합니다; 정밀한 의미적 준수, 복잡한 장면과 다중 객체 생성에 뛰어나 사용자의 창의적 의도를 더욱 잘 살려냅니다. 이 모델은 텍스트-to-비디오, 이미지-to-비디오 등 여러 생성 모드를 지원하며, 콘텐츠 제작, 예술 창작, 교육 및 훈련 등 다양한 응용 분야에 적합합니다. Wan2.2 프롬프트 가이드

모델 주요 특징

  • 영화 수준의 미적 제어: 전문적인 카메라 언어, 조명, 색감, 구도 등 다차원적 시각적 제어 지원
  • 대규모 복합 동작: 다양한 복잡한 동작을 부드럽게 복원하고, 동작의 제어성과 자연스러움을 향상시킵니다
  • 정밀한 의미적 준수: 복잡한 장면 이해, 다중 객체 생성, 창의적 의도를 더욱 잘 살려냅니다
  • 효율적인 압축 기술: 고압축률 VAE를 적용한 5B 버전, 메모리 최적화, 혼합 학습 지원

Wan2.2 오픈소스 모델 버전

Wan2.2 시리즈 모델은 Apache 2.0 오픈소스 라이선스를 기반으로 하며 상업적 사용을 지원합니다. Apache 2.0 라이선스는 원본 저작권 표시와 라이선스 텍스트를 유지하는 한, 상업적 목적을 포함해 이러한 모델을 자유롭게 사용, 수정, 배포할 수 있도록 합니다.
모델 유형모델 이름파라미터주요 기능모델 저장소
하이브리드 모델Wan2.2-TI2V-5B5B텍스트-to-비디오와 이미지-to-비디오를 모두 지원하는 하이브리드 버전, 하나의 모델로 두 가지 핵심 작업 요구사항을 충족🤗 Wan2.2-TI2V-5B
이미지-to-비디오Wan2.2-I2V-A14B14B정적 이미지를 동영상으로 변환하며, 콘텐츠 일관성과 부드러운 동작 과정을 유지🤗 Wan2.2-I2V-A14B
텍스트-to-비디오Wan2.2-T2V-A14B14B텍스트 설명으로부터 고품질 비디오를 생성하며, 영화 수준의 미적 제어와 정밀한 의미적 준수를 제공🤗 Wan2.2-T2V-A14B

ComfyOrg Wan2.2 라이브 스트림

ComfyUI Wan2.2 사용법에 대해 라이브 스트림을 진행했으니, 이를 통해 사용 방법을 확인하실 수 있습니다.
이 튜토리얼에서는 🤗 Comfy-Org/Wan_2.2_ComfyUI_Repackaged 버전을 사용하겠습니다.
Make sure your ComfyUI is updated.Workflows in this guide can be found in the Workflow Templates. If you can’t find them in the template, your ComfyUI may be outdated. (Desktop version’s update will delay sometime)If nodes are missing when loading a workflow, possible reasons:
  1. You are not using the latest ComfyUI version (Nightly version)
  2. Some nodes failed to import at startup
Wan2.2 템플릿

Wan2.2 TI2V 5B 하이브리드 버전 워크플로우 예시

Wan2.2 5B 버전은 ComfyUI 네이티브 오프로딩을 사용하면 8GB vram에서도 잘 작동합니다.

1. 워크플로우 파일 다운로드

ComfyUI를 최신 버전으로 업데이트하신 후, 메뉴 워크플로우 -> 템플릿 둘러보기 -> 비디오를 통해 “Wan2.2 5B 비디오 생성”을 찾아 워크플로우를 로드하세요.

JSON 워크플로우 파일 다운로드

Comfy Cloud에서 실행

2. 모델 수동 다운로드

디퓨전 모델 VAE 텍스트 인코더
ComfyUI/
├───📂 models/
│   ├───📂 diffusion_models/
│   │   └─── wan2.2_ti2v_5B_fp16.safetensors
│   ├───📂 text_encoders/
│   │   └─── umt5_xxl_fp8_e4m3fn_scaled.safetensors 
│   └───📂 vae/
│       └── wan2.2_vae.safetensors

3. 단계 따라하기

단계 다이어그램
  1. Load Diffusion Model 노드가 wan2.2_ti2v_5B_fp16.safetensors 모델을 로드하도록 설정하세요.
  2. Load CLIP 노드가 umt5_xxl_fp8_e4m3fn_scaled.safetensors 모델을 로드하도록 설정하세요.
  3. Load VAE 노드가 wan2.2_vae.safetensors 모델을 로드하도록 설정하세요.
  4. (선택) 이미지-to-비디오 생성이 필요하다면, Ctrl+B 단축키를 사용해 Load image 노드를 활성화하여 이미지를 업로드할 수 있습니다.
  5. (선택) Wan22ImageToVideoLatent 노드에서 크기 설정과 전체 비디오 프레임 수(length)를 조정할 수 있습니다.
  6. (선택) 프롬프트(긍정 및 부정)를 수정해야 한다면, 5단계의 CLIP Text Encoder 노드에서 직접 수정하세요.
  7. Run 버튼을 클릭하거나, 단축키 Ctrl(cmd) + Enter를 사용해 비디오 생성을 실행하세요.

Wan2.2 14B T2V 텍스트-to-비디오 워크플로우 예시

1. 워크플로우 파일

ComfyUI를 최신 버전으로 업데이트하신 후, 메뉴 워크플로우 -> 템플릿 둘러보기 -> 비디오를 통해 “Wan2.2 14B T2V”를 찾아 워크플로우를 로드하세요. 또는 ComfyUI를 최신 버전으로 업데이트한 후, 아래 비디오를 다운로드해 ComfyUI로 드래그하여 워크플로우를 로드하세요.

JSON 워크플로우 파일 다운로드

Comfy Cloud에서 실행

2. 모델 수동 다운로드

디퓨전 모델 VAE 텍스트 인코더
ComfyUI/
├───📂 models/
│   ├───📂 diffusion_models/
│   │   ├─── wan2.2_t2v_low_noise_14B_fp8_scaled.safetensors
│   │   └─── wan2.2_t2v_high_noise_14B_fp8_scaled.safetensors
│   ├───📂 text_encoders/
│   │   └─── umt5_xxl_fp8_e4m3fn_scaled.safetensors 
│   └───📂 vae/
│       └── wan_2.1_vae.safetensors

3. 단계 따라하기

단계 다이어그램
  1. 첫 번째 Load Diffusion Model 노드가 wan2.2_t2v_high_noise_14B_fp8_scaled.safetensors 모델을 로드하도록 설정하세요.
  2. 두 번째 Load Diffusion Model 노드가 wan2.2_t2v_low_noise_14B_fp8_scaled.safetensors 모델을 로드하도록 설정하세요.
  3. Load CLIP 노드가 umt5_xxl_fp8_e4m3fn_scaled.safetensors 모델을 로드하도록 설정하세요.
  4. Load VAE 노드가 wan_2.1_vae.safetensors 모델을 로드하도록 설정하세요.
  5. (선택) EmptyHunyuanLatentVideo 노드에서 크기 설정과 전체 비디오 프레임 수(length)를 조정할 수 있습니다.
  6. (선택) 프롬프트(긍정 및 부정)를 수정해야 한다면, 5단계의 CLIP Text Encoder 노드에서 직접 수정하세요.
  7. Run 버튼을 클릭하거나, 단축키 Ctrl(cmd) + Enter를 사용해 비디오 생성을 실행하세요.

Wan2.2 14B I2V 이미지-to-비디오 워크플로우 예시

1. 워크플로우 파일

ComfyUI를 최신 버전으로 업데이트하신 후, 메뉴 워크플로우 -> 템플릿 둘러보기 -> 비디오를 통해 “Wan2.2 14B I2V”를 찾아 워크플로우를 로드하세요. 또는 ComfyUI를 최신 버전으로 업데이트한 후, 아래 비디오를 다운로드해 ComfyUI로 드래그하여 워크플로우를 로드하세요.

JSON 워크플로우 파일 다운로드

Comfy Cloud에서 실행

다음 이미지를 입력으로 사용할 수 있습니다: 입력 이미지

2. 모델 수동 다운로드

디퓨전 모델 VAE 텍스트 인코더
ComfyUI/
├───📂 models/
│   ├───📂 diffusion_models/
│   │   ├─── wan2.2_i2v_low_noise_14B_fp16.safetensors
│   │   └─── wan2.2_i2v_high_noise_14B_fp16.safetensors
│   ├───📂 text_encoders/
│   │   └─── umt5_xxl_fp8_e4m3fn_scaled.safetensors 
│   └───📂 vae/
│       └── wan_2.1_vae.safetensors

3. 단계 따라하기

단계 다이어그램
  1. 첫 번째 Load Diffusion Model 노드가 wan2.2_t2v_high_noise_14B_fp8_scaled.safetensors 모델을 로드하도록 설정하세요.
  2. 두 번째 Load Diffusion Model 노드가 wan2.2_t2v_low_noise_14B_fp8_scaled.safetensors 모델을 로드하도록 설정하세요.
  3. Load CLIP 노드가 umt5_xxl_fp8_e4m3fn_scaled.safetensors 모델을 로드하도록 설정하세요.
  4. Load VAE 노드가 wan_2.1_vae.safetensors 모델을 로드하도록 설정하세요.
  5. Load Image 노드에서 초기 프레임으로 사용할 이미지를 업로드하세요.
  6. 프롬프트(긍정 및 부정)를 수정해야 한다면, 6단계의 CLIP Text Encoder 노드에서 직접 수정하세요.
  7. (선택) EmptyHunyuanLatentVideo에서 크기 설정과 전체 비디오 프레임 수(length)를 조정할 수 있습니다.
  8. Run 버튼을 클릭하거나, 단축키 Ctrl(cmd) + Enter를 사용해 비디오 생성을 실행하세요.

Wan2.2 14B FLF2V 워크플로우 예시

첫 번째와 마지막 프레임 워크플로우는 I2V 섹션과 동일한 모델 위치를 사용합니다.

1. 워크플로우 및 입력 자료 준비

아래 비디오 또는 JSON 워크플로우를 다운로드해 ComfyUI에서 열어주세요.

JSON 워크플로우 다운로드

Comfy Cloud에서 실행

다음 이미지를 입력 자료로 다운로드하세요: 입력 자료 입력 자료

2. 단계 따라하기

단계 다이어그램
  1. 첫 번째 Load Image 노드에서 시작 프레임으로 사용할 이미지를 업로드하세요.
  2. 두 번째 Load Image 노드에서 끝 프레임으로 사용할 이미지를 업로드하세요.
  3. WanFirstLastFrameToVideo 노드에서 크기 설정을 조정하세요.
    • 기본적으로 비교적 작은 크기가 설정되어 있어 낮은 VRAM 사용자가 너무 많은 리소스를 소모하지 않도록 합니다.
    • VRAM이 충분하다면 720P 정도의 해상도를 시도해볼 수 있습니다.
  4. 첫 번째와 마지막 프레임에 맞춰 적절한 프롬프트를 작성하세요.
  5. Run 버튼을 클릭하거나, 단축키 Ctrl(cmd) + Enter를 사용해 비디오 생성을 실행하세요.

커뮤니티 자료

GGUF 버전

커스텀 노드 City96/ComfyUI-GGUF

WanVideoWrapper

Kijai/ComfyUI-WanVideoWrapper Wan2.2 모델 Kijai/WanVideo_comfy_fp8_scaled Wan2.1 모델 Kijai/WanVideo_comfy/Lightx2v Lightx2v 4steps LoRA