跳转到主要内容

Documentation Index

Fetch the complete documentation index at: https://docs.comfy.org/llms.txt

Use this file to discover all available pages before exploring further.

请确保你的 ComfyUI 已经更新。本指南里的工作流可以在 ComfyUI 的工作流模板中找到。如果找不到,可能是 ComfyUI 没有更新。如果加载工作流时有节点缺失,可能原因有:
  1. 你用的不是最新开发版(nightly)。
  2. 你用的是稳定版或桌面版(没有包含最新的更新)。
  3. 启动时有些节点导入失败。
HiDream-O1-Image Demo HiDream-O1-Image 是 HiDream-ai 于 2026年5月8日 开源的原生统一图像生成基础模型。采用像素级统一变换器(UiT)架构,无需 VAE 或分离的文本编码器,支持 文生图(Text-to-Image)指令式图像编辑主体驱动个性化生成故事板生成,最高可生成 2048×2048 分辨率。 HiDream-O1-Image 基于 MIT 协议开源,ComfyUI 已原生支持(PR #13817)。 HiDream-O1-Image - GitHub

模型版本

模型推理步数模型仓库
HiDream-O1-Image(Full)50🤗 HiDream-O1-Image
HiDream-O1-Image-Dev28🤗 HiDream-O1-Image-Dev

HiDream-O1-Image Full 工作流

1. 工作流文件下载

请更新你的 ComfyUI 到最新版本,并通过菜单 工作流 -> 浏览模板 -> Image 找到 “HiDream O1 Full: Image generation” 以加载工作流。 HiDream-O1-Image Full 工作流

下载 JSON 格式工作流

Download workflow

Run on Comfy Cloud

Open in cloud

2. 手动下载模型

Checkpoint — 经过重新打包和量化。所有版本均将最严重的离群值保留在 bf16,并移除了未使用的 deepstack 层: 文本编码器(提示词优化) — 所有版本通用: LoRA(可选) — Dev 蒸馏也可以作为 LoRA 应用到 Full 模型中,让你可以调节蒸馏强度(由 Kijai 提供):
📂 ComfyUI/
├── 📂 models/
│   ├── 📂 checkpoints/
│   │   ├── hidream_o1_image_fp8_scaled.safetensors
│   │   ├── hidream_o1_image_mxfp8.safetensors
│   │   └── hidream_o1_image_bf16.safetensors
│   ├── 📂 loras/
│   │   └── hidream_o1_dev_lora_rank_64_bf16.safetensors
│   └── 📂 text_encoders/
│       └── gemma4_e4b_it_fp8_scaled.safetensors

3. 使用工作流

  • 确保 CheckpointLoaderSimple 节点加载了对应的 checkpoint 模型
  • CLIPTextEncode 节点中输入你的提示词
  • 文生图模式:将 “Switch to Image Edit” 开关设为 关闭(默认)。采样器直接使用你的文本提示词。
  • 图像编辑模式:将 “Switch to Image Edit” 设为 开启,然后在 Load Image 节点中上传参考图片,连接到 HiDreamO1ReferenceImages 节点。
注意: O1 采样器输出的是 latent 样本,需要通过 VAEDecode 节点(使用 CheckpointLoaderSimple 加载的 VAE)解码后才能看到图像。

HiDream-O1-Image Dev 工作流

1. 工作流文件下载

请更新你的 ComfyUI 到最新版本,并通过菜单 工作流 -> 浏览模板 -> Image 找到 “HiDream O1 Dev” 以加载工作流。 HiDream-O1-Image Dev 工作流

下载 JSON 格式工作流

Download workflow

Run on Comfy Cloud

Open in cloud

2. 手动下载模型

Checkpoint(Dev 版) — 经过重新打包和量化。所有版本均将最严重的离群值保留在 bf16,并移除了未使用的 deepstack 层: 文本编码器(提示词优化) — 所有版本通用:
📂 ComfyUI/
├── 📂 models/
│   ├── 📂 checkpoints/
│   │   ├── hidream_o1_image_dev_fp8_scaled.safetensors
│   │   ├── hidream_o1_image_dev_mxfp8.safetensors
│   │   └── hidream_o1_image_dev_bf16.safetensors
│   └── 📂 text_encoders/
│       └── gemma4_e4b_it_fp8_scaled.safetensors

3. 使用工作流

  • 确保 CheckpointLoaderSimple 节点加载了 hidream_o1_image_dev_fp8_scaled.safetensors
  • Dev 版本使用 28 步推理,CFG 自动设为 1.0,无需负向提示词
  • 文生图模式:将 “Switch to Image Edit” 开关设为 关闭(默认)
  • 图像编辑模式:将 “Switch to Image Edit” 设为 开启,在 Load Image 中上传参考图片,连接到 HiDreamO1ReferenceImages 节点

补充说明

  • 长文本渲染: HiDream-O1-Image 在图像中的文字渲染表现出色,在提示词中明确指定文字内容、字体风格和位置可获得更佳效果。 长文本渲染与排版控制
  • 图像缩放: 如果输入参考图像过大,可以启用 ImageScaleToTotalPixels 节点(Ctrl+B)缩放至 4MP。
  • 拼缝平滑(实验性): HiDreamO1PatchSeamSmoothing 节点可减少采样过程中的拼缝伪影。Full 工作流中默认启用。