ComfyUI Wan2.1 동영상 예시

Wan2.1 Video 시리즈는 2025년 2월 알리바바가 Apache 2.0 라이선스로 오픈소스로 공개한 동영상 생성 모델입니다. 두 가지 버전을 제공합니다:

14B (140억 파라미터)
1.3B (13억 파라미터) 텍스트 투 비디오(T2V)와 이미지 투 비디오(I2V)를 포함한 다양한 작업을 지원합니다. 이 모델은 기존 오픈소스 모델보다 성능이 뛰어날 뿐 아니라, 특히 경량화된 버전은 VRAM 8GB만으로도 실행 가능해 진입 장벽을 크게 낮췄습니다.

Wan2.1 ComfyUI 네이티브 워크플로우 예시

예시를 시작하기 전에 ComfyUI를 최신 버전으로 업데이트하여 네이티브 Wan Video 지원을 확보해 주세요.

모델 설치

이 가이드에서 언급된 모든 모델은 여기에서 확인할 수 있습니다. 아래는 이 가이드의 예시에 필요한 일반적인 모델들로, 미리 다운로드해 두시면 됩니다: 텍스트 인코더에서 하나의 버전을 선택해 다운로드하세요:

VAE

wan_2.1_vae.safetensors

CLIP 비전

clip_vision_h.safetensors

파일 저장 위치:

ComfyUI/
├── models/
│   ├── diffusion_models/
│   ├── ...                  # 해당 워크플로우에 맞는 모델을 다운로드합시다
│   ├── text_encoders/
│   │   └─── umt5_xxl_fp8_e4m3fn_scaled.safetensors
│   └── vae/
│   │   └──  wan_2.1_vae.safetensors
│   └── clip_vision/
│       └──  clip_vision_h.safetensors   

확산 모델의 경우, 본 가이드에서는 fp16 정밀도 모델을 사용합니다. 이는 bf16 버전보다 성능이 더 우수하다는 것을 발견했기 때문입니다. 다른 정밀도 버전이 필요하시다면 여기를 방문해 다운로드해 주세요.

Wan2.1 텍스트 투 비디오 워크플로우

워크플로우를 시작하기 전에 wan2.1_t2v_1.3B_fp16.safetensors를 다운로드해 ComfyUI/models/diffusion_models/ 디렉토리에 저장해 주세요.

다른 t2v 정밀도 버전이 필요하시다면 여기를 방문해 다운로드해 주세요.

1. 워크플로우 파일 다운로드

아래 파일을 다운로드해 ComfyUI로 드래그하여 해당 워크플로우를 로드하세요: Wan2.1 텍스트 투 비디오 워크플로우

2. 워크플로우 단계별 완료

Load Diffusion Model 노드가 wan2.1_t2v_1.3B_fp16.safetensors 모델을 로드했는지 확인하세요.
Load CLIP 노드가 umt5_xxl_fp8_e4m3fn_scaled.safetensors 모델을 로드했는지 확인하세요.
Load VAE 노드가 wan_2.1_vae.safetensors 모델을 로드했는지 확인하세요.
(선택사항) 필요하다면 EmptyHunyuanLatentVideo 노드에서 동영상 크기를 수정할 수 있습니다.
(선택사항) 프롬프트(긍정 및 부정)를 수정해야 한다면, 번호 5번 CLIP Text Encoder 노드에서 변경하세요.
Run 버튼을 클릭하거나 단축키 Ctrl(cmd) + Enter를 사용해 동영상 생성을 실행하세요.

Wan2.1 이미지 투 비디오 워크플로우

Wan Video는 480P와 720P 모델을 분리하고 있기 때문에, 이 가이드에서는 두 해상도 모두에 대한 예시를 제공할 것입니다. 서로 다른 모델을 사용하는 것 외에도, 매개변수에도 약간의 차이가 있습니다.

480P 버전

1. 워크플로우 및 입력 이미지

아래 이미지를 다운로드해 ComfyUI로 드래그하여 해당 워크플로우를 로드하세요: Wan2.1 이미지 투 비디오 워크플로우 14B 480P 워크플로우 예시 입력 이미지

다음 이미지를 입력으로 사용하겠습니다: Wan2.1 이미지 투 비디오 워크플로우 14B 480P 워크플로우 예시 입력 이미지

2. 모델 다운로드

wan2.1_i2v_480p_14B_fp16.safetensors를 다운로드해 ComfyUI/models/diffusion_models/ 디렉토리에 저장해 주세요.

3. 워크플로우 단계별 완료

Load Diffusion Model 노드가 wan2.1_i2v_480p_14B_fp16.safetensors 모델을 로드했는지 확인하세요.
Load CLIP 노드가 umt5_xxl_fp8_e4m3fn_scaled.safetensors 모델을 로드했는지 확인하세요.
Load VAE 노드가 wan_2.1_vae.safetensors 모델을 로드했는지 확인하세요.
Load CLIP Vision 노드가 clip_vision_h.safetensors 모델을 로드했는지 확인하세요.
제공된 입력 이미지를 Load Image 노드에 업로드하세요.
(선택사항) 생성하고자 하는 동영상 설명 내용을 CLIP Text Encoder 노드에 입력하세요.
(선택사항) 필요하다면 WanImageToVideo 노드에서 동영상 크기를 수정할 수 있습니다.
Run 버튼을 클릭하거나 단축키 Ctrl(cmd) + Enter를 사용해 동영상 생성을 실행하세요.

720P 버전

1. 워크플로우 및 입력 이미지

아래 이미지를 다운로드해 ComfyUI로 드래그하여 해당 워크플로우를 로드하세요: Wan2.1 이미지 투 비디오 워크플로우 14B 720P 워크플로우 예시 입력 이미지

다음 이미지를 입력으로 사용하겠습니다: Wan2.1 이미지 투 비디오 워크플로우 14B 720P 워크플로우 예시 입력 이미지

2. 모델 다운로드

wan2.1_i2v_720p_14B_fp16.safetensors를 다운로드해 ComfyUI/models/diffusion_models/ 디렉토리에 저장해 주세요.

3. 워크플로우 단계별 완료

Load Diffusion Model 노드가 wan2.1_i2v_720p_14B_fp16.safetensors 모델을 로드했는지 확인하세요.
Load CLIP 노드가 umt5_xxl_fp8_e4m3fn_scaled.safetensors 모델을 로드했는지 확인하세요.
Load VAE 노드가 wan_2.1_vae.safetensors 모델을 로드했는지 확인하세요.
Load CLIP Vision 노드가 clip_vision_h.safetensors 모델을 로드했는지 확인하세요.
제공된 입력 이미지를 Load Image 노드에 업로드하세요.
(선택사항) 생성하고자 하는 동영상 설명 내용을 CLIP Text Encoder 노드에 입력하세요.
(선택사항) 필요하다면 WanImageToVideo 노드에서 동영상 크기를 수정할 수 있습니다.
Run 버튼을 클릭하거나 단축키 Ctrl(cmd) + Enter를 사용해 동영상 생성을 실행하세요.

시작하기

Agent Tools / MCP

기본 개념

인터페이스 가이드

튜토리얼

파트너 노드

ComfyUI Wan2.1 동영상 예시

Wan2.1 ComfyUI 네이티브 워크플로우 예시

모델 설치