- デュアルストリーム MMDiT アーキテクチャ — 画像とテキストの統合処理で一貫性のある生成
- GPT-OSS-20B 多層テキスト特徴量 — 正確なプロンプト追従のための豊富なテキスト理解
- FLUX.2 セマンティック VAE — 高忠実度の潜在表現
- 混合解像度学習 — クロッピングなしで多様なアスペクト比に対応
- コンパクトな 3.8B パラメータ — 24 GB VRAM のコンシューマー GPU で動作
Lens テキスト画像生成ワークフロー
標準版と Turbo 版の両方で Subgraph ノードを使用してテキスト画像生成パイプラインを管理します。サブグラフを開いて内部ノードを確認・カスタマイズできます。Subgraph について
このワークフローは Subgraph ノードを使用したモジュール処理を採用しています。Subgraph のドキュメントを参照して、ワークフローのカスタマイズと拡張方法を学んでください。
Lens
ワークフローをダウンロード
JSON をダウンロード、またはテンプレートライブラリで “Lens” を検索
はじめ方
- ComfyUI を最新バージョンに更新
- テンプレート で Lens を検索
- Lens ワークフローを選択
- 不足しているモデルをダウンロードして(モデルダウンロード 参照)、プロンプトを入力し 実行 をクリック
出力例
Lens Turbo
Lens Turbo は蒸留版で、より少ないサンプリングステップで画像を生成し、高速な推論を実現します。ワークフローをダウンロード
JSON をダウンロード、またはテンプレートライブラリで “Lens Turbo” を検索
はじめ方
- ComfyUI を最新バージョンに更新
- テンプレート で Lens Turbo を検索
- Lens Turbo ワークフローを選択
- 不足しているモデルをダウンロードして(モデルダウンロード 参照)、プロンプトを入力し 実行 をクリック
出力例
モデルダウンロード
すべてのモデルファイルは Hugging Face の Comfy-Org/Lens にあります。lens_bf16.safetensors
Lens 用拡散モデル (BF16)
lens_turbo_bf16.safetensors
Lens Turbo 用拡散モデル (BF16)
gpt_oss_20b_nvfp4.safetensors
Lens と Lens Turbo で共通のテキストエンコーダー (GPT-OSS-20B)
flux2-vae.safetensors
Lens と Lens Turbo で共通の VAE (FLUX.2)
利用可能なモデル
| モデル | 説明 | 推論ステップ数 | リンク |
|---|---|---|---|
| Lens | 標準 3.8B モデル — 高品質、多ステップ | ~50 | Hugging Face |
| Lens Turbo | 蒸留版 — 少ないステップで高速生成 | ~8 | Hugging Face |