메인 콘텐츠로 건너뛰기

Wan2.1 Fun Camera 소개

Wan2.1 Fun Camera는 알리바바 팀이 출시한 동영상 생성 프로젝트로, 카메라 모션을 통해 동영상 생성 효과를 제어하는 데 중점을 두고 있습니다. 모델 가중치 다운로드: 코드 저장소: VideoX-Fun ComfyUI는 현재 Wan2.1 Fun Camera 모델을 기본적으로 지원합니다.
Make sure your ComfyUI is updated.Workflows in this guide can be found in the Workflow Templates. If you can’t find them in the template, your ComfyUI may be outdated. (Desktop version’s update will delay sometime)If nodes are missing when loading a workflow, possible reasons:
  1. You are not using the latest ComfyUI version (Nightly version)
  2. Some nodes failed to import at startup

모델 설치

이 모델들은 한 번만 설치하면 됩니다. 또한, 해당 워크플로우 이미지에 모델 다운로드 정보가 포함되어 있으므로, 원하는 방식으로 모델을 다운로드할 수 있습니다. 다음 모델들은 모두 Wan_2.1_ComfyUI_repackaged에서 찾을 수 있습니다. 디퓨전 모델은 1.3B 또는 14B 중 하나를 선택하세요: 이전에 Wan2.1 관련 모델을 사용한 적이 있다면 이미 다음 모델들이 있을 것입니다. 아직 없다면 다운로드해 주세요: 텍스트 인코더는 하나를 선택하세요: VAE CLIP 비전 파일 저장 위치:
📂 ComfyUI/
├── 📂 models/
│ ├── 📂 diffusion_models/
│ │   ├── wan2.1_fun_camera_v1.1_1.3B_bf16.safetensors # 1.3B 버전
│ │   └── wan2.1_fun_camera_v1.1_14B_bf16.safetensors # 14B 버전
│ ├── 📂 text_encoders/
│ │   └── umt5_xxl_fp8_e4m3fn_scaled.safetensors
│ ├── 📂 vae/
│ │   └── wan_2.1_vae.safetensors
│ └── 📂 clip_vision/
│     └── clip_vision_h.safetensors

ComfyUI Wan2.1 Fun Camera 1.3B 기본 워크플로우 예시

1. 워크플로우 관련 파일 다운로드

1.1 워크플로우 파일

아래 동영상을 다운로드해 ComfyUI로 드래그하여 해당 워크플로우를 로드하세요:

Json 워크플로우 파일 다운로드

14B 버전을 사용하고 싶다면 모델 파일을 14B 버전으로 교체하면 되지만, VRAM 요구 사항에 유의해 주세요.

1.2 입력 이미지 다운로드

아래 이미지를 다운로드해 시작 프레임으로 사용하세요: 입력 참조 이미지

2. 워크플로우 단계별 완료하기

Wan2.1 Fun Camera 워크플로우 단계
  1. 올바른 버전의 모델 파일이 로드되었는지 확인하세요:
    • 1.3B 버전: wan2.1_fun_camera_v1.1_1.3B_bf16.safetensors
    • 14B 버전: wan2.1_fun_camera_v1.1_14B_bf16.safetensors
  2. Load CLIP 노드가 umt5_xxl_fp8_e4m3fn_scaled.safetensors를 로드했는지 확인하세요.
  3. Load VAE 노드가 wan_2.1_vae.safetensors를 로드했는지 확인하세요.
  4. Load CLIP Vision 노드가 clip_vision_h.safetensors를 로드했는지 확인하세요.
  5. 시작 프레임을 Load Image 노드에 업로드하세요.
  6. 자체 입력 이미지를 사용한다면 프롬프트를 수정하세요.
  7. WanCameraEmbedding 노드에서 카메라 모션을 설정하세요.
  8. Run 버튼을 클릭하거나 단축키 Ctrl(cmd) + Enter를 사용해 생성을 실행하세요.

ComfyUI Wan2.1 Fun Camera 14B 워크플로우 및 입력 이미지

Json 워크플로우 파일 다운로드

입력 이미지 입력 이미지

성능 참고사항

1.3B 버전:
  • RTX 4090에서 512×512 해상도로 81프레임 생성하는 데 약 72초 소요
14B 버전:
  • RTX4090 24GB VRAM에서는 512×512 해상도 생성 시 메모리 부족 현상이 발생할 수 있으며, 더 큰 크기를 사용할 경우 A100에서도 메모리 문제가 발생했습니다.