跳转到主要内容
Ovis-Image 是一个基于 Ovis-U1 构建的 7B 文生图模型,专门针对高质量文本渲染进行优化。它能够提供与更大的 20B 级别系统相当的文本渲染质量,同时保持足够紧凑,可在常见硬件上运行。 模型亮点
  • 7B 规模下的强大文本渲染:提供与 Qwen-Image 等更大的 20B 级别系统相当的文本渲染质量,在文本场景中与 GPT4o 等领先的闭源模型具有竞争力
  • 文本密集型提示词的高保真度:擅长处理需要语言内容与渲染排版紧密对齐的提示词(如海报、横幅、标志、UI 模型、信息图表)
  • 精准的双语文本渲染:在各种字体、大小和宽高比下,生成清晰、拼写正确且语义一致的中英文文本
  • 高效且易于部署:可在单个高端 GPU 上运行,内存需求适中,支持低延迟交互使用
相关链接

Ovis-Image 文生图工作流

下载 JSON 工作流文件

  • 便携版或手动安装用户
  • 桌面版或云端用户
请确保你的 ComfyUI 已经更新。本指南里的工作流可以在 ComfyUI 的工作流模板中找到。如果找不到,可能是 ComfyUI 没有更新。如果加载工作流时有节点缺失,可能原因有:
  1. 你用的不是最新开发版(nightly)。
  2. 你用的是稳定版或桌面版(没有包含最新的更新)。
  3. 启动时有些节点导入失败。

模型链接

text_encoders(文本编码器) diffusion_models(扩散模型) vae 模型存储位置
📂 ComfyUI/
├── 📂 models/
│   ├── 📂 text_encoders/
│   │      └── ovis_2.5.safetensors
│   ├── 📂 diffusion_models/
│   │      └── ovis_image_bf16.safetensors
│   └── 📂 vae/
│          └── ae.safetensors