メインコンテンツへスキップ
Qwen-Image-Layered は、アリババ社の通義千問(Qwen)チームが開発したモデルで、入力画像を複数の RGBA レイヤーに分解することができます。このレイヤー化された表現により、本質的な編集可能性が実現されます:各レイヤーを他のコンテンツに影響を与えることなく独立して操作できます。 主な特長
  • 本質的な編集可能性:各レイヤーを他のコンテンツに影響を与えることなく独立して操作可能
  • 高忠実度の基本操作:サイズ変更、再配置、色変更をサポート。意味的コンポーネント間で物理的に分離された状態を維持
  • 可変レイヤー数の分解:固定数のレイヤーに限定されず、必要に応じて 3、4、8、あるいはそれ以上のレイヤーへと分解可能
  • 再帰的分解:任意のレイヤーをさらに細分化でき、無限の分解深度を実現
関連リンク

Qwen-Image-Layered ワークフロー

JSON ワークフローファイルをダウンロード

ComfyUI Cloud で実行

Make sure your ComfyUI is updated.Workflows in this guide can be found in the Workflow Templates. If you can’t find them in the template, your ComfyUI may be outdated. (Desktop version’s update will delay sometime)If nodes are missing when loading a workflow, possible reasons:
  1. You are not using the latest ComfyUI version (Nightly version)
  2. Some nodes failed to import at startup

モデルのダウンロード先

text_encoders diffusion_models vae モデルの保存場所
📂 ComfyUI/
├── 📂 models/
│   ├── 📂 text_encoders/
│   │      └── qwen_2.5_vl_7b_fp8_scaled.safetensors
│   ├── 📂 diffusion_models/
│   │      └── qwen_image_layered_bf16.safetensors
│   └── 📂 vae/
│          └── qwen_image_layered_vae.safetensors

FP8 バージョン

デフォルトでは bf16 を使用していますが、これは高い VRAM を必要とします。VRAM 使用量を削減したい場合は、FP8 バージョンをご利用ください: その後、サブグラフ内の Load Diffusion model ノードを更新し、このファイルを使用するように設定してください。

ワークフローの設定

サンプラー設定

このモデルは処理が遅いため、オリジナルのサンプリング設定(ステップ数: 50、CFG: 4.0)では、生成時間が少なくとも2倍になります。

入力サイズ

入力サイズとしては、640px を推奨します。高解像度出力を希望する場合は、1024px を使用してください。

プロンプト(任意)

テキストプロンプトは、入力画像全体の内容を記述することを目的としています——たとえば、前景オブジェクトの後ろに隠れている文字など、部分的に遮蔽されている要素も含めて指定可能です。ただし、個々のレイヤーの意味的内容を明示的に制御するためのものではありません。