ComfyUI Wan2.2 Fun Inp 시작-끝 프레임 동영상 생성 예제

Wan2.2-Fun-Inp는 알리바바 PAI 팀이 출시한 시작-끝 프레임 제어 동영상 생성 모델입니다. 이 모델은 시작 및 끝 프레임 이미지를 입력해 중간 전환 동영상을 생성할 수 있어 크리에이터들이 더욱 창의적인 제어를 할 수 있도록 지원합니다. 이 모델은 Apache 2.0 라이선스로 배포되며 상업적 사용도 가능합니다. 주요 특징:

시작-끝 프레임 제어: 시작 및 끝 프레임 이미지를 입력해 중간 전환 동영상을 생성할 수 있어 동영상의 일관성과 창의성을 강화합니다.
고품질 동영상 생성: Wan2.2 아키텍처를 기반으로 영화 수준의 고품질 동영상을 출력합니다.
다중 해상도 지원: 512×512, 768×768, 1024×1024 등 다양한 해상도로 동영상을 생성해 다양한 시나리오에 맞게 활용할 수 있습니다.

모델 버전:

14B 고성능 버전: 모델 크기가 32GB를 초과하며 더 나은 결과를 제공하지만 높은 VRAM을 요구합니다.

아래는 관련 모델 가중치와 코드 저장소입니다:

🤗Wan2.2-Fun-Inp-14B
코드 저장소: VideoX-Fun

ComfyOrg Wan2.2 Fun InP & Control 유튜브 라이브 스트림 다시보기

Wan2.2 Fun Inp 시작-끝 프레임 동영상 생성 워크플로우 예제

휴대용 또는 자체 배포 사용자
데스크톱 또는 클라우드 사용자

ComfyUI가 최신 버전으로 업데이트되었는지 확인하세요.

이 가이드의 워크플로우는 워크플로우 템플릿에서 확인할 수 있습니다. 템플릿에서 찾을 수 없다면, 귀하의 ComfyUI가 오래된 버전일 수 있습니다. (데스크톱 버전의 업데이트는 다소 지연될 수 있습니다)워크플로우를 로드할 때 노드가 누락되는 경우, 가능한 원인:

최신 ComfyUI 버전(야간 빌드)을 사용하고 있지 않음
일부 노드가 시작 시 가져오기에 실패함

이 워크플로우는 두 가지 버전을 제공합니다:

Wan2.2-Lightning 4단계 LoRA를 사용해 동영상 생성 속도를 높인 버전
가속화된 LoRA 없이 fp8_scaled 버전

아래는 RTX4090D 24GB VRAM GPU를 사용해 640×640 해상도, 81프레임에서 수행한 테스트 결과입니다.

모델 유형	VRAM 사용량	첫 번째 생성 시간	두 번째 생성 시간
fp8_scaled	83%	≈ 524초	≈ 520초
fp8_scaled + 4단계 LoRA	89%	≈ 138초	≈ 79초

LoRA를 통한 가속화가 큰 효과를 주지만 동영상의 역동성이 손실될 수 있으므로, 제공되는 워크플로우에서는 기본적으로 가속화된 LoRA 버전이 활성화되어 있습니다. 다른 워크플로우를 활성화하려면 해당 버전을 선택하고 Ctrl+B를 눌러 활성화하세요.

1. 워크플로우 파일 다운로드

ComfyUI를 최신 버전으로 업데이트한 후, 메뉴 워크플로우 -> 템플릿 둘러보기 -> 동영상에서 “Wan2.2 Fun Inp”를 찾아 워크플로우를 로드하세요. 또는 ComfyUI를 최신 버전으로 업데이트한 후 아래 워크플로우를 다운로드해 ComfyUI에 드래그하여 로드하세요.

JSON 워크플로우 다운로드

Comfy Cloud에서 실행

다음 자료를 시작 및 끝 프레임으로 사용하세요. Wan2.2 Fun Control ComfyUI 워크플로우 시작 프레임 자료

Wan2.2 Fun Control ComfyUI 워크플로우 끝 프레임 자료

2. 모델

디퓨전 모델

Lightning LoRA (선택사항, 가속화용)

VAE

wan_2.1_vae.safetensors

텍스트 인코더

umt5_xxl_fp8_e4m3fn_scaled.safetensors

ComfyUI/
├───📂 models/
│   ├───📂 diffusion_models/
│   │   ├─── wan2.2_fun_inpaint_high_noise_14B_fp8_scaled.safetensors
│   │   └─── wan2.2_fun_inpaint_low_noise_14B_fp8_scaled.safetensors
│   ├───📂 loras/
│   │   ├─── wan2.2_i2v_lightx2v_4steps_lora_v1_high_noise.safetensors
│   │   └─── wan2.2_i2v_lightx2v_4steps_lora_v1_low_noise.safetensors
│   ├───📂 text_encoders/
│   │   └─── umt5_xxl_fp8_e4m3fn_scaled.safetensors 
│   └───📂 vae/
│       └── wan_2.1_vae.safetensors

3. 워크플로우 안내

이 워크플로우는 LoRA를 사용합니다. 해당 디퓨전 모델과 LoRA가 서로 맞아야 합니다.

고노이즈 모델 및 LoRA 로딩
- Load Diffusion Model 노드가 wan2.2_fun_inpaint_high_noise_14B_fp8_scaled.safetensors 모델을 로드하도록 확인하세요.
- LoraLoaderModelOnly 노드가 wan2.2_i2v_lightx2v_4steps_lora_v1_high_noise.safetensors를 로드하도록 확인하세요.
저노이즈 모델 및 LoRA 로딩
- Load Diffusion Model 노드가 wan2.2_fun_inpaint_low_noise_14B_fp8_scaled.safetensors 모델을 로드하도록 확인하세요.
- LoraLoaderModelOnly 노드가 wan2.2_i2v_lightx2v_4steps_lora_v1_low_noise.safetensors를 로드하도록 확인하세요.
Load CLIP 노드가 umt5_xxl_fp8_e4m3fn_scaled.safetensors 모델을 로드하도록 확인하세요.
Load VAE 노드가 wan_2.1_vae.safetensors 모델을 로드하도록 확인하세요.
시작 및 끝 프레임 이미지를 자료로 업로드하세요.
프롬프트 그룹에 원하는 프롬프트를 입력하세요.
WanFunInpaintToVideo 노드에서 크기와 동영상 길이를 조정하세요.
- width와 height 파라미터를 조정하세요. 기본값은 640입니다. 우리는 작은 크기를 설정했지만 필요에 따라 수정할 수 있습니다.
- length를 조정하세요. 이는 총 프레임 수입니다. 현재 워크플로우의 fps는 16입니다. 예를 들어 5초짜리 동영상을 생성하려면 5×16 = 80으로 설정해야 합니다.
Run 버튼을 클릭하거나 단축키 Ctrl(cmd) + Enter를 사용해 동영상 생성을 실행하세요.

시작하기

Agent Tools / MCP

기본 개념

인터페이스 가이드

튜토리얼

파트너 노드

ComfyUI Wan2.2 Fun Inp 시작-끝 프레임 동영상 생성 예제

ComfyOrg Wan2.2 Fun InP & Control 유튜브 라이브 스트림 다시보기