メインコンテンツへスキップ
HiDream-E1 デモ HiDream-E1 は、HiDream-ai 社が公式にオープンソース化したインタラクティブな画像編集用大規模モデルであり、HiDream-I1 を基盤として構築されています。 自然言語による画像編集が可能です。本モデルは MIT ライセンス の下で公開されており、個人プロジェクト、学術研究、商用利用のいずれにも対応しています。
以前にリリースされた hidream-i1 と組み合わせることで、画像生成から画像編集までの一貫したクリエイティブな機能を実現します。
名称更新日推論ステップ数解像度HuggingFace リポジトリ
HiDream-E1-Full2025-4-2828768×768🤗 HiDream-E1-Full
HiDream-E1.12025-7-1628動的(1メガピクセル)🤗 HiDream-E1.1
HiDream E1 - GitHub
Make sure your ComfyUI is updated.Workflows in this guide can be found in the Workflow Templates. If you can’t find them in the template, your ComfyUI may be outdated. (Desktop version’s update will delay sometime)If nodes are missing when loading a workflow, possible reasons:
  1. You are not using the latest ComfyUI version (Nightly version)
  2. Some nodes failed to import at startup

HiDream E1 および E1.1 ワークフローに関連するモデル

本ガイドで使用されるすべてのモデルは、こちら から入手できます。Diffusion モデルを除き、E1 および E1.1 は同一のモデルを共有しています。
対応するワークフローファイルには、関連モデルの情報も含まれています。モデルは手動でダウンロードして保存することもできますし、ワークフローを読み込んだ後に表示されるプロンプトに従って自動的にダウンロードすることもできます。推奨は E1.1 を使用することです。
本モデルの実行には大量の VRAM を必要とします。具体的な VRAM 要件については、関連セクションをご確認ください。 Diffusion モデル 両方のモデルを同時にダウンロードする必要はありません。E1.1 は E1 をベースとした改良版であり、実際のテスト結果から、品質およびパフォーマンスの両面で E1 を大幅に上回ることが確認されています。 テキストエンコーダー VAE
これは Flux 向けの VAE モデルです。以前に Flux ワークフローをご利用になったことがある場合、すでにこのファイルをダウンロード済みである可能性があります。
モデルの保存先ディレクトリ構成:
📂 ComfyUI/
├── 📂 models/
│   ├── 📂 text_encoders/
│   │   ├─── clip_l_hidream.safetensors
│   │   ├─── clip_g_hidream.safetensors
│   │   ├─── t5xxl_fp8_e4m3fn_scaled.safetensors
│   │   └─── llama_3.1_8b_instruct_fp8_scaled.safetensors
│   └── 📂 vae/
│   │   └── ae.safetensors
│   └── 📂 diffusion_models/
│       ├── hidream_e1_1_bf16.safetensors
│       └── hidream_e1_full_bf16.safetensors

HiDream E1.1 の ComfyUI ネイティブ ワークフローの例

E1.1 は 2025年7月16日にリリースされた更新版で、動的な 1メガピクセル解像度 をサポートしています。ワークフローでは Scale Image to Total Pixels ノードを用いて、入力画像を自動的に 100万ピクセルにスケーリングします。
テスト時の VRAM 使用量の参考値は以下の通りです:
  1. A100 40GB(VRAM 使用率 95%):初回生成 211秒、2回目以降の生成 73秒
  2. RTX 4090D 24GB(VRAM 使用率 98%)
     - Full バージョン:メモリ不足(Out of memory)
     - FP8_e4m3fn_fast(VRAM 使用率 98%):初回生成 120秒、2回目以降の生成 91秒

1. HiDream E1.1 ワークフローおよび関連素材

以下の画像をダウンロードし、対応するワークフローおよびモデルが読み込まれた状態で ComfyUI にドラッグ&ドロップしてください:
HiDream E1.1 ワークフロー
以下の画像を入力画像としてダウンロードしてください:
HiDream E1.1 ワークフロー入力画像

2. HiDream-e1 ワークフローの実行手順(ステップ・バイ・ステップ)

hidream_e1_1_guide 以下の手順に従ってワークフローを実行してください:
  1. Load Diffusion Model ノードが hidream_e1_1_bf16.safetensors を正しく読み込んでいることを確認してください。
  2. QuadrupleCLIPLoader 内の4つのテキストエンコーダーが正しく読み込まれていることを確認してください:
      - clip_l_hidream.safetensors
      - clip_g_hidream.safetensors
      - t5xxl_fp8_e4m3fn_scaled.safetensors
      - llama_3.1_8b_instruct_fp8_scaled.safetensors
  3. Load VAE ノードが ae.safetensors を使用していることを確認してください。
  4. Load Image ノードで、提供された入力画像または任意の画像を読み込んでください。
  5. Empty Text Encoder(Positive) ノードに、画像に対して行いたい変更内容 を入力してください。
  6. Empty Text Encoder(Negative) ノードに、画像に含めたくない要素 を入力してください。
  7. Run ボタンをクリックするか、ショートカットキー Ctrl(macOS の場合は Cmd) + Enter を押して画像生成を実行してください。

3. ワークフローに関する補足事項

  • HiDream E1.1 は「合計ピクセル数が 100万」の動的入力をサポートするため、ワークフローでは Scale Image to Total Pixels ノードを用いてすべての入力画像を処理・変換します。このため、元の入力画像と比較してアスペクト比が変化する場合があります。
  • fp16 版モデルを使用する場合、A100 40GB および RTX 4090D 24GB における実際のテストでは、Full バージョンでメモリ不足(Out of memory)が発生しました。そのため、ワークフローはデフォルトで fp8_e4m3fn_fast を推論に使用するよう設定されています。

HiDream E1 の ComfyUI ネイティブ ワークフローの例

Comfy Cloud で実行

E1 は 2025年4月28日にリリースされたモデルで、768×768 の固定解像度のみ をサポートします。
参考までに、Google Colab L4(VRAM 22.5GB)環境で 28 ステップのサンプリングを用いた場合、初回実行に約 500 秒、2回目以降の実行に約 370 秒かかります。

1. HiDream-e1 ワークフロー

以下の画像をダウンロードし、ComfyUI にドラッグ&ドロップしてください。ワークフローには既にモデルのダウンロード情報が含まれており、読み込み後に該当モデルのダウンロードを促すメッセージが表示されます。
ComfyUI ネイティブ HiDream-e1 ワークフロー
以下の画像を入力画像としてダウンロードしてください:
ComfyUI ネイティブ HiDream-e1 ワークフロー入力画像

2. HiDream-e1 ワークフローの実行手順(ステップ・バイ・ステップ)

hidream_e1_full_step_guide 以下の手順に従ってワークフローを実行してください:
  1. Load Diffusion Model ノードが hidream_e1_full_bf16.safetensors を正しく読み込んでいることを確認してください。
  2. QuadrupleCLIPLoader 内の4つのテキストエンコーダーが正しく読み込まれていることを確認してください:
      - clip_l_hidream.safetensors
      - clip_g_hidream.safetensors
      - t5xxl_fp8_e4m3fn_scaled.safetensors
      - llama_3.1_8b_instruct_fp8_scaled.safetensors
  3. Load VAE ノードが ae.safetensors を使用していることを確認してください。
  4. Load Image ノードで、前述の手順でダウンロードした入力画像を読み込んでください。
  5. (重要)Empty Text Encoder(Positive) ノードに、画像をどのように変更したいかを表すプロンプト を入力してください。
  6. Run ボタンをクリックするか、ショートカットキー Ctrl(macOS の場合は Cmd) + Enter を押して画像生成を実行してください。

ComfyUI HiDream-e1 ワークフローに関する補足事項

  • より良い結果を得るためには、プロンプトを複数回修正したり、複数回生成を試行する必要がある場合があります。
  • 本モデルは画像スタイルの変更時に一貫性を保つのが難しく、プロンプトをできる限り詳細かつ包括的に記述することを推奨します。
  • モデルは 768×768 の解像度のみをサポートしており、他の解像度で実行した場合、画像品質が著しく低下したり、意図しない出力になることがあります。