- 듀얼 스트림 MMDiT 아키텍처 — 이미지와 텍스트를 함께 처리하여 일관성 있는 생성 가능
- GPT-OSS-20B 다중 레이어 텍스트 특징 — 정확한 프롬프트 이해를 위한 풍부한 텍스트 인식
- FLUX.2 세맨틱 VAE — 높은 충실도의 잠재 표현
- 혼합 해상도 학습 — 다양한 종횡비를 크롭 없이 지원
- 콤팩트한 38억 파라미터 크기 — 24GB VRAM을 갖춘 소비자용 GPU에서 실행 가능
Lens 텍스트-to-이미지 워크플로우
표준 버전과 Turbo 버전 모두 Subgraph 노드를 사용해 텍스트-to-이미지 생성 파이프라인을 관리합니다. Subgraph를 열어 내부 노드를 확인하거나 맞춤화할 수 있습니다.Subgraph 알아보기
이 워크플로우는 모듈식 처리를 위해 Subgraph 노드를 사용합니다. Subgraph 문서를 확인해 워크플로우를 맞춤화하고 확장하는 방법을 배워보세요.
Lens
워크플로우 다운로드
JSON 파일을 다운로드하거나 템플릿 라이브러리에서 “Lens” 검색하세요
시작하기
- ComfyUI를 최신 버전으로 업데이트하세요
- 템플릿으로 이동해 “Lens”를 검색하세요
- Lens 워크플로우를 선택하세요
- 누락된 모델을 다운로드하고(모델 다운로드 참조), 프롬프트를 입력한 후 큐를 클릭하세요
예시 출력
Lens Turbo
Lens Turbo는 추출된 변형으로, 더 적은 샘플링 단계로 이미지를 생성해 더 빠른 추론을 가능하게 합니다.워크플로우 다운로드
JSON 파일을 다운로드하거나 템플릿 라이브러리에서 “Lens Turbo” 검색하세요
시작하기
- ComfyUI를 최신 버전으로 업데이트하세요
- 템플릿으로 이동해 “Lens Turbo”를 검색하세요
- Lens Turbo 워크플로우를 선택하세요
- 누락된 모델을 다운로드하고(모델 다운로드 참조), 프롬프트를 입력한 후 큐를 클릭하세요
예시 출력
Lens 모델 다운로드
모든 모델 파일은 Hugging Face의 Comfy-Org/Lens에서 찾을 수 있습니다.lens_bf16.safetensors
Lens용 디퓨전 모델(BF16).
lens_turbo_bf16.safetensors
Lens Turbo용 디퓨전 모델(BF16).
gpt_oss_20b_nvfp4.safetensors
Lens와 Lens Turbo가 공유하는 텍스트 인코더(GPT-OSS-20B).
flux2-vae.safetensors
Lens와 Lens Turbo가 공유하는 VAE(FLUX.2).
이용 가능한 모델
| 모델 | 설명 | 추론 단계 | 링크 |
|---|---|---|---|
| Lens | 표준 38억 모델 — 더 높은 품질, 더 많은 단계 | ~50 | Hugging Face |
| Lens Turbo | 추출된 변형 — 더 적은 단계로 더 빠른 생성 | ~8 | Hugging Face |