跳转到主要内容
Qwen-Image-Layered 是阿里巴巴通义千问团队开发的模型,能够将图像分解为多个 RGBA 图层。这种分层表示解锁了固有的可编辑性:每个图层都可以独立操作而不影响其他内容。 主要特性
  • 固有可编辑性:每个图层都可以独立操作而不影响其他内容
  • 高保真基础操作:支持调整大小、重新定位和重新着色,语义组件物理隔离
  • 可变图层分解:不限于固定数量的图层 - 可根据需要分解为 3、4、8 或更多图层
  • 递归分解:任何图层都可以进一步分解,实现无限分解深度
相关链接

Qwen-Image-Layered 工作流

下载 JSON 格式工作流

请确保你的 ComfyUI 已经更新。本指南里的工作流可以在 ComfyUI 的工作流模板中找到。如果找不到,可能是 ComfyUI 没有更新。如果加载工作流时有节点缺失,可能原因有:
  1. 你用的不是最新开发版(nightly)。
  2. 你用的是稳定版或桌面版(没有包含最新的更新)。
  3. 启动时有些节点导入失败。

模型下载

text_encoders diffusion_models vae 模型保存位置
📂 ComfyUI/
├── 📂 models/
│   ├── 📂 text_encoders/
│   │      └── qwen_2.5_vl_7b_fp8_scaled.safetensors
│   ├── 📂 diffusion_models/
│   │      └── qwen_image_layered_bf16.safetensors
│   └── 📂 vae/
│          └── qwen_image_layered_vae.safetensors

FP8 版本

默认使用 bf16,需要较高显存。如需降低显存使用,可以使用 fp8 版本: 然后更新子图中的 Load Diffusion model 节点来使用它。

工作流设置

采样器设置

该模型运行较慢。原始采样设置为 steps: 50 和 CFG: 4.0,这将至少使生成时间翻倍。

输入尺寸

输入尺寸建议使用 640px。如需高分辨率输出,请使用 1024px。

提示词(可选)

文本提示词用于描述输入图像的整体内容——包括可能被部分遮挡的元素(例如,你可以指定隐藏在前景物体后面的文字)。它不是用来明确控制各个图层的语义内容的。