메인 콘텐츠로 건너뛰기
Qwen-Image-Layered는 알리바바의 Qwen팀에서 개발한 모델로, 이미지를 여러 개의 RGBA 레이어로 분해할 수 있습니다. 이 계층적 표현은 각 레이어가 독립적으로 조작 가능하도록 하여 다른 콘텐츠에 영향을 주지 않고도 각 레이어를 개별적으로 수정할 수 있게 합니다. 주요 특징:
  • 본질적인 편집 가능성: 각 레이어는 다른 콘텐츠에 영향을 주지 않고 독립적으로 조작 가능합니다.
  • 고화질 기본 연산: 세미틱 구성 요소를 물리적으로 분리하여 크기 조정, 위치 변경 및 색상 재조정을 지원합니다.
  • 가변 레이어 분해: 고정된 레이어 수에 제한되지 않으며 필요에 따라 3개, 4개, 8개 이상의 레이어로 분해 가능합니다.
  • 재귀적 분해: 어떤 레이어든 추가로 분해할 수 있어 무한한 분해 깊이를 구현할 수 있습니다.
관련 링크:

Qwen-Image-Layered 워크플로우

JSON 워크플로우 파일 다운로드

ComfyUI 클라우드에서 실행하기

Make sure your ComfyUI is updated.Workflows in this guide can be found in the Workflow Templates. If you can’t find them in the template, your ComfyUI may be outdated. (Desktop version’s update will delay sometime)If nodes are missing when loading a workflow, possible reasons:
  1. You are not using the latest ComfyUI version (Nightly version)
  2. Some nodes failed to import at startup

모델 링크

text_encoders diffusion_models vae 모델 저장 위치
📂 ComfyUI/
├── 📂 models/
│   ├── 📂 text_encoders/
│   │      └── qwen_2.5_vl_7b_fp8_scaled.safetensors
│   ├── 📂 diffusion_models/
│   │      └── qwen_image_layered_bf16.safetensors
│   └── 📂 vae/
│          └── qwen_image_layered_vae.safetensors

FP8 버전

기본적으로 bf16을 사용하며, 이는 높은 VRAM을 요구합니다. 더 낮은 VRAM 사용을 위해 fp8 버전을 사용할 수 있습니다: 그런 다음 서브그래프 내의 Load Diffusion model 노드를 업데이트하여 이를 사용하세요.

워크플로우 설정

샘플러 설정

이 모델은 느립니다. 원래 샘플링 설정은 단계: 50, CFG: 4.0이며, 이는 생성 시간을 최소 두 배로 늘릴 것입니다.

입력 크기

입력 크기로는 640px를 권장합니다. 고해상도 출력을 위해서는 1024px를 사용하세요.

프롬프트 (선택사항)

텍스트 프롬프트는 입력 이미지의 전반적인 내용을 설명하는 것을 목표로 하며, 부분적으로 가려진 요소들까지 포함합니다(예를 들어, 전경 객체 뒤에 숨겨진 텍스트를 명시할 수 있음). 개별 레이어의 의미적 내용을 명시적으로 제어하도록 설계된 것은 아닙니다.