本篇将引导了解并完成 ComfyUI 原生版本 HiDream-I1 文生图工作流实例
HiDream-I1 是智象未来(HiDream-ai)于2025年4月7日正式开源的文生图模型。该模型拥有17B参数规模,采用 MIT 许可证 发布,支持用于个人项目、科学研究以及商用,目前在多项基准测试中该模型表现优异。
混合架构设计 采用扩散模型(DiT)与混合专家系统(MoE)的结合架构:
多模态文本编码器集成 整合四个文本编码器:
原始模型版本
智象未来(HiDream-ai)提供了三个版本的 HiDream-I1 模型,以满足不同场景的需求,下面是原始的模型仓库链接:
我们将在本篇示例中使用 ComfyOrg 的 repackaged 的版本,你可以在 HiDream-I1_ComfyUI 仓库中找到我们将在本篇示例中使用的所有模型文件。
在开始前请更新你的 ComfyUI 版本,至少保证在这个提交 之后才能确保你的 ComfyUI 有 HiDream 的原生支持
对应不同 ComfyUI 原生版本 HiDream-I1 工作流的模型要求基本上是相同的,只有使用过的 diffusion models 文件不同。
如果你不知道如何选择合适的版本,请参考以下建议:
对于 dev 和 fast 版本并不需要负向提示词,所以请在采样时设置cfg
参数为 1.0
,我们对应参数设置已在相关工作流中备注。
以上三个版本的完整版本对显存要求较高,你可能需要 27GB 以上的显存才能顺利运行。在对应版本的工作流教程中,我们将会使用 fp8 版本作为示例演示,以保证大多用户都可以顺利运行,不过我们仍会在对应示例中提供不同版本的模型下载链接,你可以根据你的显存情况来选择合适的文件。
下面的模型文件是我们会共用的模型文件,请点击对应的链接进行下载,并参照模型文件保存位置进行保存,对应的 diffusion models 模型我们会在对应工作流中引导你进行下载。
text_encoders:
VAE
diffusion models 这部分我们将在对应工作流中具体引导下载对应的模型文件。
模型文件保存位置
请根据你的硬件情况选择合适的版本,点击链接并下载对应的模型文件保存到 ComfyUI/models/diffusion_models/
文件夹下。
请下载下面的图片,并拖入 ComfyUI 中以加载对应的工作流
按步骤完成工作流的运行
Load Diffusion Model
节点中使用的是 hidream_i1_full_fp8.safetensors
文件QuadrupleCLIPLoader
中四个对应的 text encoder 被正确加载
Load VAE
节点中使用的是 ae.safetensors
文件ModelSamplingSD3
中的 shift
参数为 3.0
Ksampler
节点,你需要进行以下设置
steps
设置为 50
cfg
设置为 5.0
sampler
设置为 lcm
scheduler
设置为 normal
Run
按钮,或者使用快捷键 Ctrl(cmd) + Enter(回车)
来执行图片生成请根据你的硬件情况选择合适的版本,点击链接并下载对应的模型文件保存到 ComfyUI/models/diffusion_models/
文件夹下。
请下载下面的图片,并拖入 ComfyUI 中以加载对应的工作流
按步骤完成工作流的运行
Load Diffusion Model
节点中使用的是 hidream_i1_dev_fp8.safetensors
文件QuadrupleCLIPLoader
中四个对应的 text encoder 被正确加载
Load VAE
节点中使用的是 ae.safetensors
文件ModelSamplingSD3
中的 shift
参数为 6.0
Ksampler
节点,你需要进行以下设置
steps
设置为 28
cfg
设置为 1.0
sampler
设置为 lcm
scheduler
设置为 normal
Run
按钮,或者使用快捷键 Ctrl(cmd) + Enter(回车)
来执行图片生成请根据你的硬件情况选择合适的版本,点击链接并下载对应的模型文件保存到 ComfyUI/models/diffusion_models/
文件夹下。
请下载下面的图片,并拖入 ComfyUI 中以加载对应的工作流
按步骤完成工作流的运行
Load Diffusion Model
节点中使用的是 hidream_i1_fast_fp8.safetensors
文件QuadrupleCLIPLoader
中四个对应的 text encoder 被正确加载
Load VAE
节点中使用的是 ae.safetensors
文件ModelSamplingSD3
中的 shift
参数为 3.0
Ksampler
节点,你需要进行以下设置
steps
设置为 16
cfg
设置为 1.0
sampler
设置为 lcm
scheduler
设置为 normal
Run
按钮,或者使用快捷键 Ctrl(cmd) + Enter(回车)
来执行图片生成你需要使用 City96 的 ComfyUI-GGUF 中的 Unet Loader (GGUF)
节点替换掉 Load Diffusion Model
节点来使用 GGUF 版本模型。