跳转到主要内容
Ideogram 4.0 是 Ideogram 最新推出的文生图模型,已作为开源模型发布,可以在本地完全运行。它具有出色的照片级真实感、精准的文字渲染和风格控制能力。你可以使用自然语言或 结构化 JSON Prompts 来实现对布局、颜色和图片内文字的精细控制。
请确保你的 ComfyUI 已经更新。本指南里的工作流可以在 ComfyUI 的工作流模板中找到。如果找不到,可能是 ComfyUI 没有更新。如果加载工作流时有节点缺失,可能原因有:
  1. 你用的不是最新开发版(nightly)。
  2. 你用的是稳定版或桌面版(没有包含最新的更新)。
  3. 启动时有些节点导入失败。

Ideogram 4.0 文生图工作流

在 Comfy Cloud 中运行

在 Comfy Cloud 中打开

下载工作流文件

下载 JSON 或在模板库中搜索”Ideogram v4: Text to Image”
Ideogram 4.0 生成示例 Ideogram 4.0 开源模型生成示例

Prompt 格式

开源工作流支持两种 prompt 模式:
  1. 自然语言 — 快速简单,适合简单想法
  2. 结构化 JSON — 精细控制布局、颜色和风格
工作流中包含一个 prompt 构建模板,你可以配合任何 LLM 使用来生成匹配的 JSON prompt。 工作流内的提示说明:
该模型基于结构化 JSON 描述训练(场景摘要、风格块、背景、以及可选的对象级描述,包含边界框和十六进制颜色调色板)。官方推理会根据该 schema 对 prompt 进行验证。

Ideogram 4.0 模型下载

你可以在 Hugging Face 的 Comfy-Org/Ideogram-4 找到所有重新打包的模型文件。

ideogram4_fp8_scaled.safetensors

Ideogram 4.0 扩散模型(~13.8 GB)。放入 models/diffusion_models/

ideogram4_unconditional_fp8_scaled.safetensors

Ideogram 4.0 无条件扩散模型(~13.8 GB)。放入 models/diffusion_models/

qwen3vl_8b_fp8_scaled.safetensors

Ideogram 4.0 文本编码器(~8 GB)。放入 models/text_encoders/

gemma4_e4b_it_fp8_scaled.safetensors

Ideogram 4.0 文本编码器(~2 GB)。放入 models/text_encoders/

flux2-vae.safetensors

Ideogram 4.0 VAE(~335 MB)。放入 models/vae/
模型存放路径
📂 ComfyUI/
├── 📂 models/
│   ├── 📂 diffusion_models/
│   │   ├── ideogram4_fp8_scaled.safetensors
│   │   └── ideogram4_unconditional_fp8_scaled.safetensors
│   ├── 📂 text_encoders/
│   │   ├── qwen3vl_8b_fp8_scaled.safetensors
│   │   └── gemma4_e4b_it_fp8_scaled.safetensors
│   └── 📂 vae/
│       └── flux2-vae.safetensors

了解 Subgraph 子图

该工作流使用了 Subgraph 子图节点进行模块化处理。查看子图文档了解如何定制和扩展。

工作流步骤

  1. 下载模型并放入正确目录(见上表)
  2. 下载并将工作流文件拖入 ComfyUI
  3. 在 Ideogram4 子图节点中输入你的 prompt(自然语言或结构化 JSON)
  4. (可选)使用 ResolutionSelector 节点调整分辨率
  5. 点击 Run 或使用快捷键 Ctrl(cmd) + Enter 生成图片
  6. Save Image 节点查看结果 — 输出文件保存在 ComfyUI/output/

安全过滤说明

如果看到”Image blocked by safety filter”,这是模型自带的训练安全过滤导致的。ComfyUI 没有添加任何安全过滤器。尝试调整你的 prompt 以避免触发内置安全机制。