- 精密なテキストレンダリング — 英語、中国語などにおける密度の高いレイアウト対応テキスト
- 高い命令追従性 — 複雑なプロンプト、複数オブジェクトの関係、知識集約型の説明に対応
- 構造化された視覚生成 — ポスター、漫画/アニメのストーリーボード、複数パネルの構成
- 幅広いスタイル対応 — リアルな写真表現から映画的な美学まで
- コンパクトで展開しやすい — 8B パラメータ、24 GB VRAM で動作
- 内蔵プロンプトエンハンサー — 短い入力をより豊かなプロンプトに拡張する 3B モデル
ERNIE-Image テキストから画像へのワークフロー
ワークフローのダウンロード
ERNIE-Image テキストから画像へのワークフロー JSON ファイルをダウンロードします。
Comfy Cloud で実行
このワークフローを Comfy Cloud 上で直接実行します。
はじめに
- ComfyUI を最新バージョンに更新するか、Comfy Cloud を使用してください
- テンプレート に移動し、ERNIE-Image を検索します
- ERNIE-Image ワークフローを選択します
- 不足しているモデルをダウンロードし、プロンプトを更新して 実行 をクリックします
ERNIE-Image モデルのダウンロード
リパッケージされたすべてのモデルファイルは、Hugging Face の Comfy-Org/ERNIE-Image で入手できます。ernie-image.safetensors
ERNIE-Image 用拡散モデル。
ministral-3-3b.safetensors
ERNIE-Image 用テキストエンコーダー。
ernie-image-prompt-enhancer.safetensors
ERNIE-Image 用プロンプトエンハンサーテキストエンコーダー。
flux2-vae.safetensors
ERNIE-Image 用 VAE。
ERNIE-Image-Turbo
ERNIE-Image-Turbo は DMD と RL で最適化された高速バリアントで、標準モデルに必要な約 50 ステップに対し、わずか 8 ステップ で画像を生成します。ワークフローのダウンロード
ERNIE-Image-Turbo テキストから画像へのワークフロー JSON ファイルをダウンロードします。
Comfy Cloud で実行
このワークフローを Comfy Cloud 上で直接実行します。
ERNIE-Image-Turbo モデルのダウンロード
ernie-image-turbo.safetensors
ERNIE-Image-Turbo 用拡散モデル。
ministral-3-3b.safetensors
ERNIE-Image-Turbo 用テキストエンコーダー。
ernie-image-prompt-enhancer.safetensors
ERNIE-Image-Turbo 用プロンプトエンハンサーテキストエンコーダー。
flux2-vae.safetensors
ERNIE-Image-Turbo 用 VAE。
利用可能なモデル
| モデル | 説明 | 推論ステップ数 | リンク |
|---|---|---|---|
| ERNIE-Image | メイン SFT モデル — 高品質な生成と命令追従性 | 約 50 | Hugging Face |
| ERNIE-Image-Turbo | DMD と RL で最適化されたターボモデル — 高速生成 | 8 | Hugging Face |
サンプル例
テキストレンダリングとデザインレイアウト
プロンプト
プロンプト
プロンプト
プロンプト
プロンプト
プロンプト
映画的・スタイライズされた美学
プロンプト
プロンプト
プロンプト
プロンプト
プロンプト
プロンプト
複数パネルの構成
プロンプト
プロンプト
プロンプト
プロンプト