メインコンテンツへスキップ
Qwen-Image-Layered は、アリババ社の通義千問(Qwen)チームが開発したモデルで、入力画像を複数の RGBA レイヤーに分解することができます。このレイヤー化された表現により、本質的な編集可能性が実現されます:各レイヤーを他のコンテンツに影響を与えることなく独立して操作できます。 主な特長
  • 本質的な編集可能性:各レイヤーを他のコンテンツに影響を与えることなく独立して操作可能
  • 高忠実度の基本操作:サイズ変更、再配置、色変更をサポート。意味的コンポーネント間で物理的に分離された状態を維持
  • 可変レイヤー数の分解:固定数のレイヤーに限定されず、必要に応じて 3、4、8、あるいはそれ以上のレイヤーへと分解可能
  • 再帰的分解:任意のレイヤーをさらに細分化でき、無限の分解深度を実現
関連リンク

Qwen-Image-Layered ワークフロー

JSON ワークフローファイルをダウンロード

ComfyUI Cloud で実行

ComfyUI が最新版に更新されていることを確認してください。このガイドで紹介するワークフローは、ワークフローテンプレートから入手できます。
テンプレート内に該当のワークフローが見つからない場合、ComfyUI のバージョンが古くなっている可能性があります。(デスクトップ版の更新は若干遅れることがあります)
ワークフローを読み込んだ際にノードが欠落している場合の主な原因:
  1. 最新の ComfyUI(Nightly 版)を使用していない
  2. 起動時に一部のノードのインポートに失敗している

モデルのダウンロード先

text_encoders diffusion_models vae モデルの保存場所
📂 ComfyUI/
├── 📂 models/
│   ├── 📂 text_encoders/
│   │      └── qwen_2.5_vl_7b_fp8_scaled.safetensors
│   ├── 📂 diffusion_models/
│   │      └── qwen_image_layered_bf16.safetensors
│   └── 📂 vae/
│          └── qwen_image_layered_vae.safetensors

FP8 バージョン

デフォルトでは bf16 を使用していますが、これは高い VRAM を必要とします。VRAM 使用量を削減したい場合は、FP8 バージョンをご利用ください: その後、サブグラフ内の Load Diffusion model ノードを更新し、このファイルを使用するように設定してください。

ワークフローの設定

サンプラー設定

このモデルは処理が遅いため、オリジナルのサンプリング設定(ステップ数: 50、CFG: 4.0)では、生成時間が少なくとも2倍になります。

入力サイズ

入力サイズとしては、640px を推奨します。高解像度出力を希望する場合は、1024px を使用してください。

プロンプト(任意)

テキストプロンプトは、入力画像全体の内容を記述することを目的としています——たとえば、前景オブジェクトの後ろに隠れている文字など、部分的に遮蔽されている要素も含めて指定可能です。ただし、個々のレイヤーの意味的内容を明示的に制御するためのものではありません。