메인 콘텐츠로 건너뛰기
Google Gemini는 구글이 개발한 강력한 AI 모델로, 대화 및 텍스트 생성 기능을 지원합니다. 현재 ComfyUI는 Google Gemini API를 통합하여, ComfyUI에서 관련 노드를 직접 사용해 대화 기능을 완성할 수 있도록 지원합니다. 이 가이드에서는 해당 대화 기능을 완성하는 과정을 안내해 드립니다.
To use the Partner Nodes, you need to ensure that you are logged in properly and using a permitted network environment. Please refer to the Partner Nodes Overview section of the documentation to understand the specific requirements for using the Partner Nodes.
Make sure your ComfyUI is updated.Workflows in this guide can be found in the Workflow Templates. If you can’t find them in the template, your ComfyUI may be outdated. (Desktop version’s update will delay sometime)If nodes are missing when loading a workflow, possible reasons:
  1. You are not using the latest ComfyUI version (Nightly version)
  2. Some nodes failed to import at startup

Google Gemini 챗 워크플로우

1. 워크플로우 파일 다운로드

아래 Json 파일을 다운로드한 후, ComfyUI로 드래그하여 해당 워크플로우를 로드해 주세요.

Json 형식 워크플로우 파일 다운로드

2. 워크플로우를 단계별로 완료하세요

OpenAI 챗 단계 안내
해당 템플릿에서는 역할 프롬프트를 분석하고 생성하는 프롬프트를 구축했으며, 이를 통해 이미지를 해당 드로잉 프롬프트로 해석합니다.
이미지에 표시된 번호를 참고해 기본적인 텍스트-to-image 워크플로우를 완료할 수 있습니다:
  1. 이미지 로드 노드에서 AI가 해석하도록 할 이미지를 로드하세요.
  2. (선택사항) 필요하다면 Google Gemini에서 프롬프트를 수정해 특정 작업을 수행하도록 AI에게 지시할 수 있습니다.
  3. 실행 버튼을 클릭하거나, 단축키 Ctrl(cmd) + Enter를 사용해 대화를 실행하세요.
  4. API가 결과를 반환할 때까지 기다린 후, 미리보기 모든 항목 노드에서 AI가 반환한 내용을 확인할 수 있습니다.

3. 추가 참고사항

  • 현재 파일 입력 노드인 Gemini 입력 파일은 먼저 파일을 ComfyUI/input/ 디렉토리에 업로드해야 합니다. 이 노드는 개선 중이며, 업데이트 이후 템플릿을 수정할 예정입니다.
  • 워크플로우에는 배치 이미지를 사용한 예시가 제공됩니다. 여러 이미지를 AI가 해석해야 한다면, 단계 도표를 참고해 마우스 오른쪽 클릭으로 해당 노드 모드를 항상으로 설정해 활성화할 수 있습니다.