Documentation Index
Fetch the complete documentation index at: https://docs.comfy.org/llms.txt
Use this file to discover all available pages before exploring further.
HiDream-O1-Image 是 HiDream-ai 于 2026年5月8日 开源的原生统一图像生成基础模型。采用像素级统一变换器(UiT)架构,无需 VAE 或分离的文本编码器,支持 文生图(Text-to-Image)、指令式图像编辑、主体驱动个性化生成 和 故事板生成,最高可生成 2048×2048 分辨率。
HiDream-O1-Image 基于 MIT 协议开源,ComfyUI 已原生支持(PR #13817)。
HiDream-O1-Image - GitHub
模型版本
| 模型 | 推理步数 | 模型仓库 |
|---|---|---|
| HiDream-O1-Image(Full) | 50 | 🤗 HiDream-O1-Image |
| HiDream-O1-Image-Dev | 28 | 🤗 HiDream-O1-Image-Dev |
HiDream-O1-Image Full 工作流
1. 工作流文件下载
请更新你的 ComfyUI 到最新版本,并通过菜单工作流 -> 浏览模板 -> Image 找到 “HiDream O1 Full: Image generation” 以加载工作流。
下载 JSON 格式工作流
Download workflow
Run on Comfy Cloud
Open in cloud
2. 手动下载模型
Checkpoint — 经过重新打包和量化。所有版本均将最严重的离群值保留在 bf16,并移除了未使用的 deepstack 层:- hidream_o1_image_fp8_scaled.safetensors — FP8 量化版,在支持的硬件上使用 fp8/mxfp8 矩阵乘法加速安全 MLP 层
- hidream_o1_image_mxfp8.safetensors — MXFP8 量化变体
- hidream_o1_image_bf16.safetensors — bf16 全精度版(文件最大)
- hidream_o1_dev_lora_rank_64_bf16.safetensors — 全秩版
- hidream_o1_dev_lora_rank_64_bf16_pruned_v1.safetensors — 剪枝版
- hidream_o1_image_dev_2604_lora_avg_rankg_224_bf16.safetensors — 基于 checkpoint 的替代蒸馏
3. 使用工作流
- 确保
CheckpointLoaderSimple节点加载了对应的 checkpoint 模型 - 在
CLIPTextEncode节点中输入你的提示词 - 文生图模式:将 “Switch to Image Edit” 开关设为 关闭(默认)。采样器直接使用你的文本提示词。
- 图像编辑模式:将 “Switch to Image Edit” 设为 开启,然后在
Load Image节点中上传参考图片,连接到HiDreamO1ReferenceImages节点。
注意: O1 采样器输出的是 latent 样本,需要通过VAEDecode节点(使用CheckpointLoaderSimple加载的 VAE)解码后才能看到图像。
HiDream-O1-Image Dev 工作流
1. 工作流文件下载
请更新你的 ComfyUI 到最新版本,并通过菜单工作流 -> 浏览模板 -> Image 找到 “HiDream O1 Dev” 以加载工作流。
下载 JSON 格式工作流
Download workflow
Run on Comfy Cloud
Open in cloud
2. 手动下载模型
Checkpoint(Dev 版) — 经过重新打包和量化。所有版本均将最严重的离群值保留在 bf16,并移除了未使用的 deepstack 层:- hidream_o1_image_dev_fp8_scaled.safetensors — FP8 量化版,在支持的硬件上使用 fp8/mxfp8 矩阵乘法加速安全 MLP 层
- hidream_o1_image_dev_mxfp8.safetensors — MXFP8 量化变体
- hidream_o1_image_dev_bf16.safetensors — bf16 全精度版(文件最大)
3. 使用工作流
- 确保
CheckpointLoaderSimple节点加载了hidream_o1_image_dev_fp8_scaled.safetensors - Dev 版本使用 28 步推理,CFG 自动设为 1.0,无需负向提示词
- 文生图模式:将 “Switch to Image Edit” 开关设为 关闭(默认)
- 图像编辑模式:将 “Switch to Image Edit” 设为 开启,在
Load Image中上传参考图片,连接到HiDreamO1ReferenceImages节点
补充说明
-
长文本渲染: HiDream-O1-Image 在图像中的文字渲染表现出色,在提示词中明确指定文字内容、字体风格和位置可获得更佳效果。
-
图像缩放: 如果输入参考图像过大,可以启用
ImageScaleToTotalPixels节点(Ctrl+B)缩放至 4MP。 -
拼缝平滑(实验性):
HiDreamO1PatchSeamSmoothing节点可减少采样过程中的拼缝伪影。Full 工作流中默认启用。