- 7B 规模下的强大文本渲染:提供与 Qwen-Image 等更大的 20B 级别系统相当的文本渲染质量,在文本场景中与 GPT4o 等领先的闭源模型具有竞争力
- 文本密集型提示词的高保真度:擅长处理需要语言内容与渲染排版紧密对齐的提示词(如海报、横幅、标志、UI 模型、信息图表)
- 精准的双语文本渲染:在各种字体、大小和宽高比下,生成清晰、拼写正确且语义一致的中英文文本
- 高效且易于部署:可在单个高端 GPU 上运行,内存需求适中,支持低延迟交互使用
Ovis-Image 文生图工作流
下载 JSON 工作流文件