- 35 亿参数模型:高效且强大的模型规模,适合高质量动漫生成
- Next-DiT 架构:基于 Lumina 架构研究,采用全新设计的 NewBie 架构
- 双文本编码器:使用 Gemma3-4B-it 作为主编码器,配合 Jina CLIP v2 提升提示词理解能力
- FLUX VAE:采用 FLUX.1-dev 16 通道 VAE,呈现更丰富的色彩和更精细的纹理细节
- XML 结构化提示词:支持 XML 格式,实现更好的注意力绑定和属性解耦
NewBie-image 文生图工作流
下载 JSON 工作流文件
在 ComfyUI Cloud 上运行
模型下载链接
text_encoders diffusion_models vae 模型存放位置提示词格式
NewBie-image 是一个针对角色生成优化的动漫图像生成模型。它使用 XML 结构化提示词进行训练,每个<> 标签定义一个类别(如 <appearance>、<clothing>),</> 作为结束标记。标签内部使用标准的 Danbooru 标签。这种结构能够精确控制多角色场景,实现更好的属性绑定。
完整的提示词编写指南请参阅官方文档。
NewBie-image-Exp0.1 支持三种提示词格式:
- 自然语言:标准文本描述
- 标签:Danbooru 风格标签
- XML 结构化格式:推荐用于多角色场景
XML 结构化提示词
对于多角色场景,使用 XML 结构化提示词通常能获得更准确的图像生成结果,具有更好的注意力绑定和属性解耦效果。XML 标签参考
| 标签 | 描述 |
|---|---|
<n> | 角色名称/标识符 |
<gender> | 角色性别(1girl、1boy 等) |
<appearance> | 外貌特征(头发、眼睛、体型) |
<clothing> | 服装和配饰 |
<expression> | 面部表情 |
<action> | 姿势和动作 |
<position> | 图像中的位置 |
<count> | 角色数量 |
<style> | 艺术风格 |
<background> | 背景描述 |
<atmosphere> | 整体氛围 |
<quality> | 质量标签 |
<objects> | 场景中的物品 |
<other> | 其他标签 |