메인 콘텐츠로 건너뛰기
Qwen-Image-Edit는 Qwen-Image의 이미지 편집 버전입니다. 20B Qwen-Image 모델을 기반으로 추가로 학습되었으며, Qwen-Image만의 독특한 텍스트 렌더링 기능을 편집 작업에 성공적으로 확장해 정밀한 텍스트 편집이 가능합니다. 또한 Qwen-Image-Edit는 입력 이미지를 Qwen2.5-VL(시각적 세미틱 제어용)과 VAE 인코더(시각적 외관 제어용)에 동시에 입력하여 이중 세미틱 및 외관 편집 기능을 구현합니다. 모델 특징 특징은 다음과 같습니다:
  • 정밀한 텍스트 편집: Qwen-Image-Edit는 중국어와 영어 두 언어의 텍스트 편집을 지원하며, 이미지 내 텍스트를 직접 추가, 삭제, 수정할 수 있으며 원본 텍스트 크기, 폰트, 스타일을 그대로 유지합니다.
  • 이중 세미틱/외관 편집: Qwen-Image-Edit는 저수준 시각적 외관 편집(스타일 전송, 추가, 삭제, 수정 등)뿐만 아니라 고수준 시각적 세미틱 편집(IP 생성, 객체 회전 등)도 지원합니다.
  • 강력한 크로스 벤치마크 성능: 여러 공개 벤치마크에서의 평가 결과, Qwen-Image-Edit는 편집 작업에서 SOTA 성능을 달성해 이미지 생성의 강력한 기초 모델이 되었습니다.
공식 링크:

ComfyOrg Qwen-Image-Edit 라이브 스트림

Qwen-Image-Edit ComfyUI 네이티브 워크플로우 예시

Make sure your ComfyUI is updated.Workflows in this guide can be found in the Workflow Templates. If you can’t find them in the template, your ComfyUI may be outdated. (Desktop version’s update will delay sometime)If nodes are missing when loading a workflow, possible reasons:
  1. You are not using the latest ComfyUI version (Nightly version)
  2. Some nodes failed to import at startup

1. 워크플로우 파일

ComfyUI를 업데이트한 후, 템플릿에서 워크플로우 파일을 찾거나 아래 워크플로우를 ComfyUI로 드래그해 불러올 수 있습니다. Qwen-image 텍스트-이미지 워크플로우

JSON 워크플로우 다운로드

ComfyUI 클라우드에서 실행

아래 이미지를 입력으로 다운로드하세요 Qwen-image 텍스트-이미지 워크플로우

2. 모델 다운로드

모든 모델은 Comfy-Org/Qwen-Image_ComfyUI 또는 Comfy-Org/Qwen-Image-Edit_ComfyUI에서 확인할 수 있습니다. 디퓨전 모델 LoRA 텍스트 인코더 VAE 모델 저장 위치
📂 ComfyUI/
├── 📂 models/
│   ├── 📂 diffusion_models/
│   │   └── qwen_image_edit_fp8_e4m3fn.safetensors
│   ├── 📂 loras/
│   │   └── Qwen-Image-Lightning-4steps-V1.0.safetensors
│   ├── 📂 vae/
│   │   └── qwen_image_vae.safetensors
│   └── 📂 text_encoders/
│       └── qwen_2.5_vl_7b_fp8_scaled.safetensors

3. 단계에 따라 워크플로우 완료하기

단계 다이어그램
  1. 모델 로딩
    • Load Diffusion Model 노드가 qwen_image_edit_fp8_e4m3fn.safetensors를 로드하도록 설정하세요.
    • Load CLIP 노드가 qwen_2.5_vl_7b_fp8_scaled.safetensors를 로드하도록 설정하세요.
    • Load VAE 노드가 qwen_image_vae.safetensors를 로드하도록 설정하세요.
  2. 이미지 로딩
    • Load Image 노드가 편집할 이미지를 업로드하도록 설정하세요.
  3. 프롬프트 설정
    • CLIP Text Encoder 노드에서 프롬프트를 설정하세요.
  4. 전체 픽셀 수로 이미지 스케일링 노드는 입력 이미지를 총 백만 픽셀로 스케일링합니다.
    • 주로 2048x2048과 같은 과대한 입력 이미지로 인해 출력 이미지의 품질 손실을 방지하기 위해 사용됩니다.
    • 입력 이미지 크기에 익숙하다면 Ctrl+B를 사용해 이 노드를 건너뛸 수 있습니다.
  5. 4단계 라이팅 LoRA를 사용해 이미지 생성 속도를 높이고 싶다면 LoraLoaderModelOnly 노드를 선택하고 Ctrl+B를 눌러 활성화하세요.
  6. Ksampler 노드의 stepscfg 설정에 대해 노드 아래에 최적의 파라미터 설정을 테스트할 수 있는 메모를 추가했습니다.
  7. Queue 버튼을 클릭하거나 단축키 Ctrl(cmd) + Enter를 사용해 워크플로우를 실행하세요.