메인 콘텐츠로 건너뛰기
칸딘스키 5.0칸딘스키 랩에서 개발한 비디오 및 이미지 생성용 확산 모델 패밀리입니다. 칸딘스키 5.0 T2V Lite는 경량 2B 파라미터 모델로, 최고 수준의 오픈소스 비디오 생성 모델 중 하나이며 최대 10초 길이의 비디오를 생성할 수 있습니다.
ComfyUI가 최신 버전으로 업데이트되었는지 확인하세요.이 가이드의 워크플로우는 워크플로우 템플릿에서 확인할 수 있습니다. 템플릿에서 찾을 수 없다면, 귀하의 ComfyUI가 오래된 버전일 수 있습니다. (데스크톱 버전의 업데이트는 다소 지연될 수 있습니다)워크플로우를 로드할 때 노드가 누락되는 경우, 가능한 원인:
  1. 최신 ComfyUI 버전(야간 빌드)을 사용하고 있지 않음
  2. 일부 노드가 시작 시 가져오기에 실패함

개요

칸딘스키 5.0은 플로우 매칭을 사용한 잠재 확산 파이프라인을 사용하며 다음과 같은 특징을 갖습니다:
  • 확산 트랜스포머 (DiT): 텍스트 임베딩에 대한 크로스 어텐션을 갖춘 주요 생성 백본
  • Qwen2.5-VL 및 CLIP: 고품질 텍스트 임베딩 제공
  • HunyuanVideo 3D VAE: 비디오를 잠재 공간으로 인코딩하고 디코딩합니다
이 모델 패밀리는 다양한 사용 사례에 최적화된 여러 변형을 포함합니다:
  • SFT 모델: 최고의 생성 품질
  • CFG 증류형: 2배 더 빠른 추론
  • 확산 증류형: 6배 더 빠른 속도와 최소한의 품질 손실 (16단계)
  • 사전 학습 모델: 미세 조정용으로 설계됨
모든 모델은 5초 및 10초 비디오 생성 버전으로 제공됩니다.

모델 변형

모델비디오 지속시간NFE지연 시간 (H100)
칸딘스키 5.0 T2V Lite SFT5초 / 10초100139초 / 224초
칸딘스키 5.0 T2V Lite no-CFG5초 / 10초5077초 / 124초
칸딘스키 5.0 T2V Lite 증류5초 / 10초1635초 / 61초
칸딘스키 5.0 I2V Lite5초100673초

텍스트-비디오 워크플로우

1. 워크플로우 파일 다운로드

ComfyUI를 최신 버전으로 업데이트해 주시고, 메뉴 워크플로우 -> 템플릿 탐색 -> 비디오를 통해 “칸딘스키 5.0 T2V”를 찾아 워크플로우를 로드해 주세요.

JSON 워크플로우 파일 다운로드

2. 모델 수동 다운로드

텍스트 인코더 확산 모델 VAE
ComfyUI/
├── 📂 models/
│   ├── 📂 text_encoders/
│   │      ├── qwen_2.5_vl_7b_fp8_scaled.safetensors
│   │      └── clip_l.safetensors
│   ├── 📂 diffusion_models/
│   │      └── kandinsky5lite_t2v_sft_5s.safetensors
│   └── 📂 vae/
│          └── hunyuan_video_vae_bf16.safetensors

이미지-비디오 워크플로우

1. 워크플로우 파일 다운로드

ComfyUI를 최신 버전으로 업데이트해 주시고, 메뉴 워크플로우 -> 템플릿 탐색 -> 비디오를 통해 “칸딘스키 5.0 I2V”를 찾아 워크플로우를 로드해 주세요.

JSON 워크플로우 파일 다운로드

2. 모델 수동 다운로드

텍스트 인코더 확산 모델 VAE
ComfyUI/
├── 📂 models/
│   ├── 📂 text_encoders/
│   │      ├── qwen_2.5_vl_7b_fp8_scaled.safetensors
│   │      └── clip_l.safetensors
│   ├── 📂 diffusion_models/
│   │      └── kandinsky5lite_i2v_5s.safetensors
│   └── 📂 vae/
│          └── hunyuan_video_vae_bf16.safetensors

자료