メインコンテンツへスキップ
Qwen-Image-2512 は、Qwen-Image のテキストから画像を生成する基盤モデルの12月アップデート版です。8月にリリースされたベース版 Qwen-Image モデルと比較して、Qwen-Image-2512 は画像品質およびリアリズムにおいて大幅な向上を実現しています。 Qwen-Image-2512 の主な強化点:
  • 人物のリアリズム向上: 「AI生成」らしい不自然さを大幅に低減し、特に人物を主体とした画像の全体的なリアリズムを顕著に高めます
  • より精細な自然ディテール: 風景、動物の毛並み、その他の自然要素の描画において、より繊細で詳細な表現を実現します
  • テキストレンダリングの改善: テキスト要素の正確性および品質を向上させ、レイアウトの最適化と、より忠実なマルチモーダル(テキスト+画像)構成を達成します
公式リンク:

対応するアスペクト比

アスペクト比解像度
1:11328×1328
16:91664×928
9:16928×1664
4:31472×1104
3:41104×1472
3:21584×1056
2:31056×1584

Qwen-Image-2512 ComfyUI ネイティブワークフローの例

ComfyUI が最新版に更新されていることを確認してください。このガイドで紹介するワークフローは、ワークフローテンプレートから入手できます。
テンプレート内に該当のワークフローが見つからない場合、ComfyUI のバージョンが古くなっている可能性があります。(デスクトップ版の更新は若干遅れることがあります)
ワークフローを読み込んだ際にノードが欠落している場合の主な原因:
  1. 最新の ComfyUI(Nightly 版)を使用していない
  2. 起動時に一部のノードのインポートに失敗している
Comfy Cloud で実行

1. ワークフローファイル

ComfyUI を更新した後、テンプレートからワークフローファイルを見つけるか、以下のワークフローを ComfyUI にドラッグ&ドロップして読み込むことができます。 このワークフローには、以下の2つのサブグラフが含まれています:
  • Text to Image (Qwen-Image 2512): 標準的な50ステップ生成
  • Text to Image (Qwen-Image 2512 4steps): Lightning LoRA を用いた高速4ステップ生成

JSON ワークフローをダウンロード

2. モデルのダウンロード

テキストエンコーダー LoRA(任意:4ステップ Lightning 加速用) 拡散モデル VAE モデルの保存場所
📂 ComfyUI/
├── 📂 models/
│   ├── 📂 text_encoders/
│   │      └── qwen_2.5_vl_7b_fp8_scaled.safetensors
│   ├── 📂 loras/
│   │      └── Qwen-Image-Lightning-4steps-V1.0.safetensors
│   ├── 📂 diffusion_models/
│   │      ├── qwen_image_2512_bf16.safetensors
│   │      └── qwen_image_2512_fp8_e4m3fn.safetensors
│   └── 📂 vae/
│          └── qwen_image_vae.safetensors