メインコンテンツへスキップ
LensMicrosoft によるオープンなテキスト画像生成モデルで、MIT ライセンスで提供されています。38億 パラメータを持ち、デュアルストリーム MMDiT アーキテクチャに GPT-OSS-20B テキストエンコーダーの特徴量と FLUX.2 セマンティック VAE を組み合わせ、より大規模なモデルよりも少ない学習計算量で競争力のある画質を実現します。 モデルのハイライト
  • デュアルストリーム MMDiT アーキテクチャ — 画像とテキストの統合処理で一貫性のある生成
  • GPT-OSS-20B 多層テキスト特徴量 — 正確なプロンプト追従のための豊富なテキスト理解
  • FLUX.2 セマンティック VAE — 高忠実度の潜在表現
  • 混合解像度学習 — クロッピングなしで多様なアスペクト比に対応
  • コンパクトな 3.8B パラメータ — 24 GB VRAM のコンシューマー GPU で動作
関連リンク

Lens テキスト画像生成ワークフロー

標準版と Turbo 版の両方で Subgraph ノードを使用してテキスト画像生成パイプラインを管理します。サブグラフを開いて内部ノードを確認・カスタマイズできます。

Subgraph について

このワークフローは Subgraph ノードを使用したモジュール処理を採用しています。Subgraph のドキュメントを参照して、ワークフローのカスタマイズと拡張方法を学んでください。

Lens

ワークフローをダウンロード

JSON をダウンロード、またはテンプレートライブラリで “Lens” を検索
ComfyUI が最新版に更新されていることを確認してください。このガイドで紹介するワークフローは、ワークフローテンプレートから入手できます。
テンプレート内に該当のワークフローが見つからない場合、ComfyUI のバージョンが古くなっている可能性があります。(デスクトップ版の更新は若干遅れることがあります)
ワークフローを読み込んだ際にノードが欠落している場合の主な原因:
  1. 最新の ComfyUI(Nightly 版)を使用していない
  2. 起動時に一部のノードのインポートに失敗している

はじめ方

  1. ComfyUI を最新バージョンに更新
  2. テンプレートLens を検索
  3. Lens ワークフローを選択
  4. 不足しているモデルをダウンロードして(モデルダウンロード 参照)、プロンプトを入力し 実行 をクリック

出力例

Lens テキスト画像生成の出力例

Lens Turbo

Lens Turbo は蒸留版で、より少ないサンプリングステップで画像を生成し、高速な推論を実現します。

ワークフローをダウンロード

JSON をダウンロード、またはテンプレートライブラリで “Lens Turbo” を検索

はじめ方

  1. ComfyUI を最新バージョンに更新
  2. テンプレートLens Turbo を検索
  3. Lens Turbo ワークフローを選択
  4. 不足しているモデルをダウンロードして(モデルダウンロード 参照)、プロンプトを入力し 実行 をクリック

出力例

Lens Turbo テキスト画像生成の出力例

モデルダウンロード

すべてのモデルファイルは Hugging Face の Comfy-Org/Lens にあります。

lens_bf16.safetensors

Lens 用拡散モデル (BF16)

lens_turbo_bf16.safetensors

Lens Turbo 用拡散モデル (BF16)

gpt_oss_20b_nvfp4.safetensors

Lens と Lens Turbo で共通のテキストエンコーダー (GPT-OSS-20B)

flux2-vae.safetensors

Lens と Lens Turbo で共通の VAE (FLUX.2)
モデルの保存場所
📂 ComfyUI/
├── 📂 models/
│   ├── 📂 diffusion_models/
│   │   ├── lens_bf16.safetensors(または lens_mxfp8.safetensors)
│   │   └── lens_turbo_bf16.safetensors(または lens_turbo_mxfp8.safetensors)
│   ├── 📂 text_encoders/
│   │   └── gpt_oss_20b_nvfp4.safetensors
│   └── 📂 vae/
│       └── flux2-vae.safetensors

利用可能なモデル

モデル説明推論ステップ数リンク
Lens標準 3.8B モデル — 高品質、多ステップ~50Hugging Face
Lens Turbo蒸留版 — 少ないステップで高速生成~8Hugging Face