gpt-image-2)는 ComfyUI에서 파트너 노드를 통해 이용 가능한 OpenAI의 최신 이미지 모델입니다. 이 모델은 생성에 앞서 ‘추론’을 수행하는 최초의 OpenAI 이미지 모델로, 일회성 샘플링 대신 구성 계획을 세우고 작업을 점검하며 반복적으로 수정합니다.
이 노드는 다음을 지원합니다:
- 밀도 높은 텍스트, UI 요소, 아이콘, 인포그래픽, 지도, 슬라이드, 만화 컷 등을 강력하게 처리하는 텍스트-to-이미지 생성
- 최대 2K 해상도에서 높은 구조적 정확도를 유지하는 이미지 편집
- 하나의 프롬프트로부터 최대 8개의 일관된 이미지 생성, 캐릭터와 객체의 연속성을 보존
노드 개요
GPT-Image-2는 노드 라이브러리의 OpenAI GPT Image 1.5 노드에서model 옵션으로 선택됩니다. 이 노드는 OpenAI의 이미지 생성 API를 동기식으로 호출하고 설명과 일치하는 이미지를 반환합니다.
시작하기
- ComfyUI를 최신 버전(v0.19.4 이상)으로 업데이트하거나 Comfy Cloud를 사용하세요.
- 노드 라이브러리에서 OpenAI GPT Image 1.5를 검색하여 노드를 추가하세요.
model필드를gpt-image-2로 설정하세요.
사용 가능한 워크플로우
텍스트-to-이미지(T2I)
GPT-Image-2의 추론 기반 구성으로 텍스트 프롬프트를 통해 이미지를 생성하세요.Cloud에서 텍스트-to-이미지 실행
Comfy Cloud에서 바로 텍스트-to-이미지 워크플로우를 시험해 보세요.
텍스트-to-이미지 워크플로우 다운로드
워크플로우 JSON을 다운로드하세요.
이미지 편집
최대 2K 해상도에서 높은 구조적 정확도로 입력 이미지를 편집하세요.Cloud에서 이미지 편집 실행
Comfy Cloud에서 바로 이미지 편집 워크플로우를 시험해 보세요.
이미지 편집 워크플로우 다운로드
워크플로우 JSON을 다운로드하세요.
주요 기능
추론 기반 생성
GPT-Image-2는 렌더링 전에 구성 계획을 세웁니다. 이는 역사적으로 이미지 모델이 잘 작동하지 않았던 프롬프트들—예를 들어, 11pt 헬베티카체로 작성된 일곱 항목의 글머리표가 중앙에 배치된 포스터—에 적합하며, 밀도 높은 텍스트, 작은 UI 요소, 아이콘, 인포그래픽, 지도, 슬라이드 등에도 깔끔한 결과를 제공합니다.중요한 부분을 보존하는 이미지 편집
GPT-Image-2는 구조적 정확도를 유지하면서 표적 편집을 처리하며, 편집 영역 외부는 픽셀 단위로 안정적으로 유지하면서 최대 2K 해상도에서 요청된 변경 사항을 깔끔하게 적용합니다. 흑백 사진을 컬러로 바꾸거나, 정오의 장면을 황혼으로 바꾸면서 얼굴이나 기하학적 형태, 세밀한 디테일이 왜곡되지 않도록 활용할 수 있습니다.하나의 프롬프트당 최대 8개의 일관된 이미지
모델은 하나의 프롬프트로부터 최대 8개의 서로 다른 이미지를 반환하며, 시리즈 전체에서 캐릭터와 객체의 연속성을 유지합니다. 이는 스토리보드, 참고 자료, 캐릭터 변형, 제품 변형 작업에 유용하며, 시드 잠금이나 프롬프트 조작 없이 바로Save Image 노드에 연결하거나 이후 비디오 워크플로우로 연결할 수 있습니다.