メインコンテンツへスキップ
HiDream-I1 デモ HiDream-I1 は、HiDream-ai 社が 2025 年 4 月 7 日に公式にオープンソース化したテキストから画像へ変換するモデルです。このモデルは 17B(170 億)パラメータを有し、MIT ライセンス の下で公開されており、個人プロジェクト、学術研究、商用利用のすべてに対応しています。現在、複数のベンチマークテストにおいて優れた性能を発揮しています。

モデルの特徴

ハイブリッドアーキテクチャ設計
拡散トランスフォーマー(DiT)とエキスパートの混合(MoE)アーキテクチャを組み合わせた設計:
  • DiT を基盤とし、マルチモーダル情報を処理するための双方向ストリーム型 MMDiT モジュールと、グローバルな一貫性を最適化する単一ストリーム型 DiT モジュールを採用。
  • 動的ルーティング機構により、計算リソースを柔軟に配分することで、複雑なシーン処理能力を向上させ、色再現性やエッジ処理などの細部表現においても優れた性能を発揮します。
マルチモーダルテキストエンコーダの統合
以下の 4 種類のテキストエンコーダを統合:
  • OpenCLIP ViT-bigG、OpenAI CLIP ViT-L(視覚的・意味的な整合性確保)
  • T5-XXL(長文の解析)
  • Llama-3.1-8B-Instruct(指示文の理解) この組み合わせにより、色・数量・空間関係など、複雑な意味解析において SOTA(State-of-the-Art)レベルの性能を達成しており、中国語プロンプトへの対応力は同様のオープンソースモデルと比較して著しく優れています。
オリジナルモデルのバージョン HiDream-ai 社は、さまざまな用途に対応するため、HiDream-I1 モデルを以下の 3 種類のバージョンで提供しています。各バージョンのリポジトリリンクは以下の通りです:
モデル名説明推論ステップ数リポジトリリンク
HiDream-I1-Full完全版50🤗 HiDream-I1-Full
HiDream-I1-Dev蒸留済み開発版28🤗 HiDream-I1-Dev
HiDream-I1-Fast蒸留済み高速版16🤗 HiDream-I1-Fast

本ワークフロー例について

本例では、ComfyOrg が再パッケージしたバージョンを使用します。本例で使用するすべてのモデルファイルは、HiDream-I1_ComfyUI リポジトリから入手できます。
開始前に、ComfyUI を最新版に更新してください。HiDream のネイティブサポートを確実に利用するには、少なくともこの コミット 以降のバージョンが必要です。

HiDream-I1 ワークフロー

ComfyUI ネイティブ版 HiDream-I1 の各種ワークフローにおけるモデル要件は基本的に同一であり、異なるのは diffusion models ファイルのみです。 どのバージョンを選択すべきか迷う場合は、以下の推奨事項をご参照ください:
  • HiDream-I1-Full:最高品質の画像生成が可能
  • HiDream-I1-Dev:高品質な画像生成と速度のバランスを重視
  • HiDream-I1-Fast:わずか 16 ステップで画像を生成可能。リアルタイムでの反復試行が必要なシナリオに最適
dev および fast バージョンでは、ネガティブプロンプトは不要です。そのため、サンプリング時に cfg パラメータを 1.0 に設定してください。該当するワークフローには、対応するパラメータ設定が明記されています。
上記 3 バージョンの完全版は、非常に大きな VRAM を必要とします。スムーズな動作には 27GB を超える VRAM が必要になる可能性があります。対応するワークフローチュートリアルでは、fp8 版をデモンストレーション用として使用し、大多数のユーザーが問題なく実行できるよう配慮しています。ただし、各チュートリアルでは、VRAM の状況に応じて選択可能な、異なるバージョンのモデルのダウンロードリンクも併せてご提供します。

モデルのインストール

以下に示すモデルファイルは、本例で共通して使用するファイルです。
各リンクをクリックしてダウンロードし、指定された保存場所に配置してください。
diffusion models については、それぞれのワークフローで個別にダウンロード方法をご案内します。
text_encoders VAE
  • ae.safetensors これは Flux の VAE モデルであり、以前に Flux のワークフローを使用したことがある場合、すでにダウンロード済みである可能性があります。
diffusion models
対応するワークフローで、該当するモデルファイルのダウンロード方法をご案内します。
モデルファイルの保存場所
📂 ComfyUI/
├── 📂 models/
│   ├── 📂 text_encoders/
│   │   ├─── clip_l_hidream.safetensors
│   │   ├─── clip_g_hidream.safetensors
│   │   ├─── t5xxl_fp8_e4m3fn_scaled.safetensors
│   │   └─── llama_3.1_8b_instruct_fp8_scaled.safetensors
│   └── 📂 vae/
│   │   └── ae.safetensors
│   └── 📂 diffusion_models/
│       └── ...               # 対応するバージョンのワークフローでインストール方法をご案内します       

HiDream-I1 Full バージョンのワークフロー

Comfy Cloud で実行

1. モデルファイルのダウンロード

ハードウェア環境に応じて適切なバージョンを選択し、対応するリンクをクリックして、ComfyUI/models/diffusion_models/ フォルダにダウンロードしてください。

2. ワークフローファイルのダウンロード

以下の画像をダウンロードし、ComfyUI にドラッグ&ドロップして、対応するワークフローを読み込んでください。
HiDream-I1 Full バージョンのワークフロー

3. ワークフローの実行手順(ステップバイステップ)

HiDream-I1 Full バージョンのフローダイアグラム ワークフローの実行を以下の手順で完了してください:
  1. Load Diffusion Model ノードが hidream_i1_full_fp8.safetensors ファイルを使用していることを確認してください。
  2. QuadrupleCLIPLoader 内の 4 つのテキストエンコーダが正しく読み込まれていることを確認してください:
    • clip_l_hidream.safetensors
    • clip_g_hidream.safetensors
    • t5xxl_fp8_e4m3fn_scaled.safetensors
    • llama_3.1_8b_instruct_fp8_scaled.safetensors
  3. Load VAE ノードが ae.safetensors ファイルを使用していることを確認してください。
  4. Full バージョンでは、ModelSamplingSD3 ノードの shift パラメータを 3.0 に設定してください。
  5. Ksampler ノードでは、以下の設定を行ってください:
    • steps50 に設定
    • cfg5.0 に設定
    • (任意)samplerlcm に設定
    • (任意)schedulernormal に設定
  6. Run ボタンをクリックするか、ショートカットキー Ctrl(Cmd)+ Enter を押して、画像生成を実行してください。

HiDream-I1 Dev バージョンのワークフロー

Comfy Cloud で実行

1. モデルファイルのダウンロード

ハードウェア環境に応じて適切なバージョンを選択し、対応するリンクをクリックして、ComfyUI/models/diffusion_models/ フォルダにダウンロードしてください。

2. ワークフローファイルのダウンロード

以下の画像をダウンロードし、ComfyUI にドラッグ&ドロップして、対応するワークフローを読み込んでください。
HiDream-I1 Dev バージョンのワークフロー

3. ワークフローの実行手順(ステップバイステップ)

HiDream-I1 Dev バージョンのフローダイアグラム ワークフローの実行を以下の手順で完了してください:
  1. Load Diffusion Model ノードが hidream_i1_dev_fp8.safetensors ファイルを使用していることを確認してください。
  2. QuadrupleCLIPLoader 内の 4 つのテキストエンコーダが正しく読み込まれていることを確認してください:
    • clip_l_hidream.safetensors
    • clip_g_hidream.safetensors
    • t5xxl_fp8_e4m3fn_scaled.safetensors
    • llama_3.1_8b_instruct_fp8_scaled.safetensors
  3. Load VAE ノードが ae.safetensors ファイルを使用していることを確認してください。
  4. Dev バージョンでは、ModelSamplingSD3 ノードの shift パラメータを 6.0 に設定してください。
  5. Ksampler ノードでは、以下の設定を行ってください:
    • steps28 に設定
    • (重要)cfg1.0 に設定
    • (任意)samplerlcm に設定
    • (任意)schedulernormal に設定
  6. Run ボタンをクリックするか、ショートカットキー Ctrl(Cmd)+ Enter を押して、画像生成を実行してください。

HiDream-I1 Fast バージョンのワークフロー

Comfy Cloud で実行

1. モデルファイルのダウンロード

ハードウェア環境に応じて適切なバージョンを選択し、対応するリンクをクリックして、ComfyUI/models/diffusion_models/ フォルダにダウンロードしてください。

2. ワークフローファイルのダウンロード

以下の画像をダウンロードし、ComfyUI にドラッグ&ドロップして、対応するワークフローを読み込んでください。
HiDream-I1 Fast バージョンのワークフロー

3. ワークフローの実行手順(ステップバイステップ)

HiDream-I1 Fast バージョンのフローダイアグラム ワークフローの実行を以下の手順で完了してください:
  1. Load Diffusion Model ノードが hidream_i1_fast_fp8.safetensors ファイルを使用していることを確認してください。
  2. QuadrupleCLIPLoader 内の 4 つのテキストエンコーダが正しく読み込まれていることを確認してください:
    • clip_l_hidream.safetensors
    • clip_g_hidream.safetensors
    • t5xxl_fp8_e4m3fn_scaled.safetensors
    • llama_3.1_8b_instruct_fp8_scaled.safetensors
  3. Load VAE ノードが ae.safetensors ファイルを使用していることを確認してください。
  4. Fast バージョンでは、ModelSamplingSD3 ノードの shift パラメータを 3.0 に設定してください。
  5. Ksampler ノードでは、以下の設定を行ってください:
    • steps16 に設定
    • (重要)cfg1.0 に設定
    • (任意)samplerlcm に設定
    • (任意)schedulernormal に設定
  6. Run ボタンをクリックするか、ショートカットキー Ctrl(Cmd)+ Enter を押して、画像生成を実行してください。

その他の関連リソース

GGUF バージョンのモデル

GGUF バージョンのモデルを利用するには、City96 が提供する ComfyUI-GGUF 拡張の Unet Loader (GGUF) ノードを、標準の Load Diffusion Model ノードと置き換える必要があります。

NF4 バージョンのモデル