OpenAI GPT-Image-2 노드

OpenAI GPT-Image-2(gpt-image-2)는 ComfyUI에서 파트너 노드를 통해 이용 가능한 OpenAI의 최신 이미지 모델입니다. 이 모델은 생성에 앞서 ‘추론’을 수행하는 최초의 OpenAI 이미지 모델로, 일회성 샘플링 대신 구성 계획을 세우고 작업을 점검하며 반복적으로 수정합니다. 이 노드는 다음을 지원합니다:

밀도 높은 텍스트, UI 요소, 아이콘, 인포그래픽, 지도, 슬라이드, 만화 컷 등을 강력하게 처리하는 텍스트 → 이미지 생성
최대 2K 해상도에서 높은 구조적 정확도를 유지하는 이미지 편집
하나의 프롬프트로부터 최대 8개의 일관된 이미지 생성, 캐릭터와 객체의 연속성을 보존

노드 개요

GPT-Image-2는 노드 라이브러리의 OpenAI GPT Image 1.5 노드에서 model 옵션으로 선택됩니다. 이 노드는 OpenAI의 이미지 생성 API를 동기식으로 호출하고 설명과 일치하는 이미지를 반환합니다.

파트너 노드를 사용하려면 올바르게 로그인되어 있고 허가된 네트워크 환경을 사용하고 있는지 확인해야 합니다. 파트너 노드를 사용하기 위한 구체적인 요구사항은 문서의 파트너 노드 개요 섹션을 참조해 주세요.

휴대용 또는 자체 배포 사용자
데스크톱 또는 클라우드 사용자

ComfyUI가 최신 버전으로 업데이트되었는지 확인하세요.

이 가이드의 워크플로우는 워크플로우 템플릿에서 확인할 수 있습니다. 템플릿에서 찾을 수 없다면, 귀하의 ComfyUI가 오래된 버전일 수 있습니다. (데스크톱 버전의 업데이트는 다소 지연될 수 있습니다)워크플로우를 로드할 때 노드가 누락되는 경우, 가능한 원인:

최신 ComfyUI 버전(야간 빌드)을 사용하고 있지 않음
일부 노드가 시작 시 가져오기에 실패함

시작하기

ComfyUI를 최신 버전(v0.19.4 이상)으로 업데이트하거나 Comfy Cloud를 사용하세요.
노드 라이브러리에서 OpenAI GPT Image 1.5를 검색하여 노드를 추가하세요.
model 필드를 gpt-image-2로 설정하세요.

사용 가능한 워크플로

텍스트 → 이미지 (T2I)

GPT-Image-2의 추론 기반 구성으로 텍스트 프롬프트를 통해 이미지를 생성하세요.

Cloud에서 텍스트 → 이미지 실행

Comfy Cloud에서 텍스트 → 이미지 워크플로를 즉시 시험해 보세요.

텍스트 → 이미지 워크플로 다운로드

워크플로 JSON을 다운로드하세요.

이미지 편집

최대 2K 해상도에서 높은 구조적 정확도로 입력 이미지를 편집하세요.

Cloud에서 이미지 편집 실행

Comfy Cloud에서 이미지 편집 워크플로를 즉시 시험해 보세요.

이미지 편집 워크플로 다운로드

워크플로 JSON을 다운로드하세요.

주요 기능

추론 기반 생성

GPT-Image-2는 렌더링 전에 구성 계획을 세웁니다. 이는 역사적으로 이미지 모델이 잘 작동하지 않았던 프롬프트들(예를 들어, 11pt 헬베티카체로 작성된 일곱 항목의 글머리표가 중앙에 배치된 포스터)에 적합하며, 밀도 높은 텍스트, 작은 UI 요소, 아이콘, 인포그래픽, 지도, 슬라이드 등에도 깔끔한 결과를 제공합니다.

중요한 부분을 보존하는 이미지 편집

GPT-Image-2는 구조적 정확도를 유지하면서 표적 편집을 처리하며, 편집 영역 외부는 픽셀 단위로 안정적으로 유지하면서 최대 2K 해상도에서 요청된 변경 사항을 깔끔하게 적용합니다. 흑백 사진을 컬러로 바꾸거나, 정오의 장면을 황혼으로 바꾸면서 얼굴이나 기하학적 형태, 세밀한 디테일이 왜곡되지 않도록 활용할 수 있습니다.

하나의 프롬프트당 최대 8개의 일관된 이미지

모델은 하나의 프롬프트로부터 최대 8개의 서로 다른 이미지를 반환하며, 시리즈 전체에서 캐릭터와 객체의 연속성을 유지합니다. 이는 스토리보드, 참고 자료, 캐릭터 변형, 제품 변형 작업에 유용하며, 시드 잠금이나 프롬프트 조작 없이 바로 Save Image 노드에 연결하거나 이후 비디오 워크플로로 연결할 수 있습니다. GPT-Image-2 일관된 이미지 예시

하이브리드 파이프라인

GPT-Image-2는 자연스럽게 하이브리드 파이프라인에 통합됩니다: 텍스트가 많은 헤로 프레임에는 GPT-Image-2를 사용한 후, 현지 모델로 넘겨 업스케일링, 스타일화, 비디오 생성을 진행하세요. 각 단계에 가장 적합한 모델을 한 그래프 내에서 사용할 수 있습니다.

시작하기

Agent Tools / MCP

기본 개념

인터페이스 가이드

튜토리얼

파트너 노드

OpenAI GPT-Image-2 노드

노드 개요

시작하기