メインコンテンツへスキップ
Qwen-Image-2512 は、Qwen-Image のテキストから画像を生成する基盤モデルの12月アップデート版です。8月にリリースされたベース版 Qwen-Image モデルと比較して、Qwen-Image-2512 は画像品質およびリアリズムにおいて大幅な向上を実現しています。 Qwen-Image-2512 の主な強化点:
  • 人物のリアリズム向上: 「AI生成」らしい不自然さを大幅に低減し、特に人物を主体とした画像の全体的なリアリズムを顕著に高めます
  • より精細な自然ディテール: 風景、動物の毛並み、その他の自然要素の描画において、より繊細で詳細な表現を実現します
  • テキストレンダリングの改善: テキスト要素の正確性および品質を向上させ、レイアウトの最適化と、より忠実なマルチモーダル(テキスト+画像)構成を達成します
公式リンク:

対応するアスペクト比

アスペクト比解像度
1:11328×1328
16:91664×928
9:16928×1664
4:31472×1104
3:41104×1472
3:21584×1056
2:31056×1584

Qwen-Image-2512 ComfyUI ネイティブワークフローの例

Make sure your ComfyUI is updated.Workflows in this guide can be found in the Workflow Templates. If you can’t find them in the template, your ComfyUI may be outdated. (Desktop version’s update will delay sometime)If nodes are missing when loading a workflow, possible reasons:
  1. You are not using the latest ComfyUI version (Nightly version)
  2. Some nodes failed to import at startup
Comfy Cloud で実行

1. ワークフローファイル

ComfyUI を更新した後、テンプレートからワークフローファイルを見つけるか、以下のワークフローを ComfyUI にドラッグ&ドロップして読み込むことができます。 このワークフローには、以下の2つのサブグラフが含まれています:
  • Text to Image (Qwen-Image 2512): 標準的な50ステップ生成
  • Text to Image (Qwen-Image 2512 4steps): Lightning LoRA を用いた高速4ステップ生成

JSON ワークフローをダウンロード

2. モデルのダウンロード

テキストエンコーダー LoRA(任意:4ステップ Lightning 加速用) 拡散モデル VAE モデルの保存場所
📂 ComfyUI/
├── 📂 models/
│   ├── 📂 text_encoders/
│   │      └── qwen_2.5_vl_7b_fp8_scaled.safetensors
│   ├── 📂 loras/
│   │      └── Qwen-Image-Lightning-4steps-V1.0.safetensors
│   ├── 📂 diffusion_models/
│   │      ├── qwen_image_2512_bf16.safetensors
│   │      └── qwen_image_2512_fp8_e4m3fn.safetensors
│   └── 📂 vae/
│          └── qwen_image_vae.safetensors