メインコンテンツへスキップ
NewBie-image-Exp0.1 は、NewBieAI Lab が開発した 35 億パラメータの DiT(Diffusion Transformer)モデルで、アニメスタイルの文生成画像タスク専用に設計されています。Next-DiT アーキテクチャを採用しており、非常に詳細で視覚的に印象的なアニメ画像を生成できます。 主な特徴
  • 35 億パラメータモデル:高品質なアニメ画像生成に十分な性能を備えながらも効率的なモデルサイズ
  • Next-DiT アーキテクチャ:Lumina アーキテクチャの研究に基づき、新たに設計された NewBie 固有のアーキテクチャを採用
  • 二重テキストエンコーダー:メインエンコーダーとして Gemma3-4B-it を使用し、Jina CLIP v2 を補助エンコーダーとして活用することで、プロンプトの理解精度を向上
  • FLUX VAE:FLUX.1-dev の 16 チャネル VAE を採用し、より豊かな色表現と精細なテクスチャディテールを実現
  • XML 構造化プロンプト:注意機構の正確なバインディングおよび属性の分離(disentanglement)を可能にする XML 形式をサポート
関連リンク

NewBie-image 文生成画像ワークフロー

JSON ワークフローファイルをダウンロード

ComfyUI Cloud で実行

Make sure your ComfyUI is updated.Workflows in this guide can be found in the Workflow Templates. If you can’t find them in the template, your ComfyUI may be outdated. (Desktop version’s update will delay sometime)If nodes are missing when loading a workflow, possible reasons:
  1. You are not using the latest ComfyUI version (Nightly version)
  2. Some nodes failed to import at startup

モデルのダウンロードリンク

text_encoders diffusion_models vae モデルの保存場所
ComfyUI/
├── models/
│   ├── text_encoders/
│   │      ├── gemma_3_4b_it_bf16.safetensors
│   │      └── jina_clip_v2_bf16.safetensors
│   ├── diffusion_models/
│   │      └── NewBie-Image-Exp0.1-bf16.safetensors
│   └── vae/
│          └── ae.safetensors

プロンプト形式

NewBie-image は、キャラクター生成に特化して最適化されたアニメ画像生成モデルです。学習には XML 構造化プロンプトが用いられており、各 <> タグはカテゴリ(例:<appearance><clothing>)を定義し、</> で閉じられます。タグ内の内容は標準の Danbooru タグです。この構造により、複数キャラクターを含むシーンにおいて、属性の正確なバインディングを実現できます。 完全なプロンプト作成ガイドについては、公式ドキュメントをご参照ください。 NewBie-image-Exp0.1 は以下の 3 種類のプロンプト形式をサポートします:
  • 自然言語:標準的なテキストによる記述
  • タグ形式:Danbooru スタイルのタグ
  • XML 構造化形式:複数キャラクターを含むシーンに推奨

XML 構造化プロンプト

複数キャラクターを含むシーンでは、XML 構造化プロンプトを用いることで、より正確な画像生成結果が得られ、注意機構のバインディングや属性の分離(disentanglement)が向上します。
<character_1>
<n>$character_1$</n>
<gender>1girl</gender>
<appearance>chibi, red_eyes, blue_hair, long_hair, hair_between_eyes, head_tilt, tareme, closed_mouth</appearance>
<clothing>school_uniform, serafuku, white_sailor_collar, white_shirt, short_sleeves, red_neckerchief, bow, blue_skirt, miniskirt, pleated_skirt, blue_hat, mini_hat, thighhighs, grey_thighhighs, black_shoes, mary_janes</clothing>
<expression>happy, smile</expression>
<action>standing, holding, holding_briefcase</action>
<position>center_left</position>
</character_1>

<character_2>
<n>$character_2$</n>
<gender>1girl</gender>
<appearance>chibi, red_eyes, pink_hair, long_hair, very_long_hair, multi-tied_hair, open_mouth</appearance>
<clothing>school_uniform, serafuku, white_sailor_collar, white_shirt, short_sleeves, red_neckerchief, bow, red_skirt, miniskirt, pleated_skirt, hair_bow, multiple_hair_bows, white_bow, ribbon_trim, ribbon-trimmed_bow, white_thighhighs, black_shoes, mary_janes, bow_legwear, bare_arms</clothing>
<expression>happy, smile</expression>
<action>standing, holding, holding_briefcase, waving</action>
<position>center_right</position>
</character_2>

<general_tags>
<count>2girls, multiple_girls</count>
<style>anime_style, digital_art</style>
<background>white_background, simple_background</background>
<atmosphere>cheerful</atmosphere>
<quality>high_resolution, detailed</quality>
<objects>briefcase</objects>
<other>alternate_costume</other>
</general_tags>

XML タグ一覧

タグ説明
<n>キャラクター名または識別子
<gender>キャラクターの性別(例:1girl1boy など)
<appearance>外見的特徴(髪型、目の色、体型など)
<clothing>服装およびアクセサリー
<expression>顔の表情
<action>姿勢および動作
<position>画像内における位置
<count>キャラクターの人数
<style>アートスタイル
<background>背景の描写
<atmosphere>全体の雰囲気(ムード)
<quality>画質に関するタグ
<objects>シーン内に存在する物品
<other>その他の追加タグ