메인 콘텐츠로 건너뛰기
The settings described on this page are located in the ComfyUI in-app settings menu. You can open it by navigating to Settings (gear icon) or using the Ctrl + , keyboard shortcut, then select the corresponding category to view and configure these options.
현재 서버 구성 설정 메뉴는 데스크톱 버전에만 존재하며, 다른 버전에는 이 설정 메뉴 항목이 없습니다.

네트워크

호스트: 수신할 IP 주소

  • 기능: 서버가 바인딩할 IP 주소를 설정합니다. 기본값 127.0.0.1은 로컬 접속만 허용됨을 의미합니다. LAN 접속이 필요하다면 0.0.0.0으로 설정할 수 있습니다.
데스크톱 버전에서는 LAN 수신 설정을 제공하지만, 데스크톱 애플리케이션으로서 서버로 사용하기에는 적합하지 않습니다. LAN 내에서 ComfyUI를 공공 서비스로 사용해야 한다면, 매뉴얼 배포 튜토리얼을 참고해 해당 ComfyUI 서비스를 배포하시기를 권장합니다.

포트: 수신할 포트

기능: 서버가 수신하는 포트 번호입니다. 데스크톱 버전의 기본 포트는 8000이며, 웹 버전은 일반적으로 8188 포트를 사용합니다.

TLS 키 파일: HTTPS용 TLS 키 파일 경로

기능: HTTPS 암호화에 필요한 개인 키 파일 경로로, 안전한 연결을 구축하는 데 사용됩니다.

TLS 인증서 파일: HTTPS용 TLS 인증서 파일 경로

기능: HTTPS 암호화에 필요한 인증서 파일 경로로, 개인 키와 함께 사용됩니다.

CORS 헤더 활성화: 모든 출처에 ”*” 사용 또는 도메인 지정

기능: 크로스 오리진 리소스 공유 설정으로, 웹 브라우저가 다른 도메인에서 서버에 접근할 수 있도록 합니다.

최대 업로드 크기(MB)

기능: 단일 파일 업로드의 최대 크기를 MB 단위로 제한하며, 기본값은 100MB입니다. 이미지, 모델 및 기타 파일의 업로드 제한에 영향을 줍니다.

CUDA

사용할 CUDA 장치 인덱스

기능: 사용할 NVIDIA 그래픽 카드를 지정합니다. 0은 첫 번째 그래픽 카드를 나타내며, 1은 두 번째를 나타냅니다. 멀티 GPU 시스템에서 중요합니다.

메모리 할당에 CUDA malloc 사용

기능: CUDA의 메모리 할당자를 사용할지 여부를 제어합니다. 특정 상황에서 메모리 관리 효율성을 높일 수 있습니다.

추론

글로벌 부동소수점 정밀도

기능: 모델 계산의 숫자 정밀도를 설정합니다. FP16은 VRAM을 절약하지만 품질에 영향을 줄 수 있으며, FP32는 더 정확하지만 더 많은 VRAM을 사용합니다.

UNET 정밀도

옵션:
  • auto: 가장 적합한 정밀도를 자동으로 선택합니다.
  • fp64: 64비트 부동소수점 정밀도로, 가장 높은 정밀도이지만 VRAM 사용량이 가장 많습니다.
  • fp32: 32비트 부동소수점 정밀도로, 표준 정밀도입니다.
  • fp16: 16비트 부동소수점 정밀도로, VRAM을 절약할 수 있습니다.
  • bf16: 16비트 브레인 부동소수점 정밀도로, fp16과 fp32 사이에 위치합니다.
  • fp8_e4m3fn: 8비트 부동소수점 정밀도(e4m3)로, VRAM 사용량이 가장 적습니다.
  • fp8_e5m2: 8비트 부동소수점 정밀도(e5m2)로, VRAM 사용량이 가장 적습니다.
기능: 확산 모델의 UNET 핵심 구성 요소의 계산 정밀도를 구체적으로 제어합니다. 높은 정밀도는 더 나은 이미지 생성 품질을 제공하지만 더 많은 VRAM을 사용합니다. 낮은 정밀도는 VRAM을 크게 절약할 수 있지만 생성 결과의 품질에 영향을 줄 수 있습니다.

VAE 정밀도

옵션 및 권장 사항:
  • auto: 가장 적합한 정밀도를 자동으로 선택하며, 8~12GB VRAM을 가진 사용자에게 권장합니다.
  • fp16: 16비트 부동소수점 정밀도로, 6GB 이하 VRAM을 가진 사용자에게 권장되며, VRAM을 절약할 수 있지만 품질에 영향을 줄 수 있습니다.
  • fp32: 32비트 부동소수점 정밀도로, 16GB 이상 VRAM을 가진 사용자 중 최고 품질을 추구하는 경우 권장됩니다.
  • bf16: 16비트 브레인 부동소수점 정밀도로, 이 형식을 지원하는 최신 그래픽 카드에 권장되며, 더 나은 성능 균형을 얻을 수 있습니다.
기능: 변분 오토인코더(VAE)의 계산 정밀도를 제어하며, 이미지 인코딩/디코딩의 품질과 속도에 영향을 줍니다. 높은 정밀도는 더 나은 이미지 복원 품질을 제공하지만 더 많은 VRAM을 사용합니다. 낮은 정밀도는 VRAM을 절약할 수 있지만 이미지 디테일 복원에 영향을 줄 수 있습니다.

CPU에서 VAE 실행

기능: VAE를 CPU에서 강제로 실행하도록 하며, VRAM을 절약할 수 있지만 처리 속도가 저하됩니다.

텍스트 인코더 정밀도

옵션:
  • auto: 가장 적합한 정밀도를 자동으로 선택합니다.
  • fp8_e4m3fn: 8비트 부동소수점 정밀도(e4m3)로, VRAM 사용량이 가장 적습니다.
  • fp8_e5m2: 8비트 부동소수점 정밀도(e5m2)로, VRAM 사용량이 가장 적습니다.
  • fp16: 16비트 부동소수점 정밀도로, VRAM을 절약할 수 있습니다.
  • fp32: 32비트 부동소수점 정밀도로, 표준 정밀도입니다.
기능: 텍스트 프롬프트 인코더의 계산 정밀도를 제어하며, 텍스트 이해의 정확성과 VRAM 사용량에 영향을 줍니다. 높은 정밀도는 더 정확한 텍스트 이해를 제공하지만 더 많은 VRAM을 사용합니다. 낮은 정밀도는 VRAM을 절약할 수 있지만 프롬프트 파싱의 효과에 영향을 줄 수 있습니다.

메모리

채널-마지막 메모리 형식 강제 적용

기능: 메모리 내 데이터 배열을 변경하며, 특정 하드웨어에서 성능을 향상시킬 수 있습니다.

DirectML 장치 인덱스

기능: Windows에서 DirectML 가속을 사용할 때 장치를 지정하며, 주로 AMD 그래픽 카드에 사용됩니다.

IPEX 최적화 비활성화

기능: Intel CPU 최적화를 비활성화하며, 주로 Intel 프로세서 성능에 영향을 줍니다.

VRAM 관리 모드

옵션:
  • auto: VRAM을 자동으로 관리하며, 모델 크기와 요구사항에 따라 VRAM을 할당합니다.
  • lowvram: 저용량 VRAM 모드로, 최소한의 VRAM을 사용하며 생성 품질에 영향을 줄 수 있습니다.
  • normalvram: 표준 VRAM 모드로, VRAM 사용량과 성능 간의 균형을 맞춥니다.
  • highvram: 고용량 VRAM 모드로, 더 나은 성능을 위해 더 많은 VRAM을 사용합니다.
  • novram: VRAM을 전혀 사용하지 않으며, 전적으로 시스템 메모리에서 실행합니다.
  • cpu: 그래픽 카드를 사용하지 않고 CPU 전용 모드입니다.
기능: VRAM 사용 전략을 제어하며, 자동 관리, 저용량 VRAM 모드 등을 선택할 수 있습니다.

예약된 VRAM(GB)

기능: 운영체제와 다른 프로그램을 위해 예약된 VRAM의 양으로, 시스템 동결을 방지합니다.

스마트 메모리 관리 비활성화

기능: 자동 메모리 최적화를 비활성화하며, 모델이 VRAM을 해방하기 위해 시스템 메모리로 이동하도록 강제합니다.

미리보기

잠재 미리보기에 사용되는 방법

옵션:
  • none: 미리보기 이미지를 표시하지 않으며, 생성 중 진행률 막대만 표시합니다.
  • auto: 가장 적합한 미리보기 방법을 자동으로 선택하며, 시스템 성능과 VRAM에 따라 동적으로 조정합니다.
  • latent2rgb: 잠재 공간 데이터를 바로 RGB 이미지로 변환하여 미리보기하며, 속도는 빠르지만 품질은 평균적입니다.
  • taesd: 경량 TAESD 모델을 사용하여 미리보기하며, 속도와 품질 간의 균형을 맞춥니다.
기능: 생성 중 중간 결과를 어떻게 미리보기할지 제어합니다. 서로 다른 미리보기 방법은 미리보기 품질과 성능 소모에 영향을 줍니다. 적절한 미리보기 방법을 선택하면 미리보기 효과와 시스템 자원 사용 간의 균형을 찾을 수 있습니다.

미리보기 이미지의 크기

기능: 미리보기 이미지의 해상도를 설정하며, 미리보기 선명도와 성능에 영향을 줍니다. 큰 크기는 더 높은 미리보기 품질을 제공하지만 더 많은 VRAM을 소모합니다.

캐시

클래식 캐시 시스템 사용

기능: 전통적인 캐싱 전략을 사용하며, 보다 보수적이지만 안정적입니다.

최대 N개 노드 결과를 캐시하는 LRU 캐싱 사용

기능: 최근 사용되지 않은(LRU) 알고리즘 캐싱 시스템을 사용하며, 지정된 수의 노드 계산 결과를 캐시할 수 있습니다. 설명:
  • 특정 숫자를 설정하여 최대 캐시 개수를 제어하며, 예를 들어 10, 50, 100 등으로 설정할 수 있습니다.
  • 캐싱을 통해 동일한 노드 연산의 반복 계산을 피할 수 있어 워크플로우 실행 속도를 향상시킵니다.
  • 캐시가 한계에 도달하면 자동으로 가장 오래된 결과를 삭제합니다.
  • 캐시된 결과는 시스템 메모리(RAM/VRAM)를 차지하며, 값이 클수록 더 많은 메모리를 사용합니다.
사용 권장 사항:
  • 기본값은 null로, LRU 캐싱이 비활성화됨을 의미합니다.
  • 시스템 메모리 용량과 사용 요구사항에 따라 적절한 캐시 개수를 설정하세요.
  • 같은 노드 구성이 자주 재사용되는 워크플로우에 권장됩니다.
  • 시스템 메모리가 충분하다면 더 큰 값을 설정하여 성능 향상을 기대할 수 있습니다.

주의

크로스 주의 방법

옵션:
  • auto: 가장 적합한 주의 계산 방법을 자동으로 선택합니다.
  • split: 블록별 주의 계산으로, VRAM을 절약할 수 있지만 속도는 느립니다.
  • quad: 쿼드 주의 알고리즘을 사용하며, 속도와 VRAM 사용량 간의 균형을 맞춥니다.
  • pytorch: PyTorch 기본 주의 계산을 사용하며, 속도는 빠르지만 VRAM 사용량이 높습니다.
기능: 모델이 주의를 계산할 때 사용하는 특정 알고리즘을 제어합니다. 서로 다른 알고리즘은 생성 품질, 속도, VRAM 사용량 간에 서로 다른 타협점을 제공합니다. 보통 auto를 사용하여 자동 선택하는 것이 좋습니다.

주의 상승 강제

기능: 고정밀 주의 계산을 강제하며, 품질을 향상시키지만 VRAM 사용량을 증가시킵니다.

주의 상승 방지

기능: 고정밀 주의 계산을 비활성화하며, VRAM을 절약합니다.

일반

xFormers 최적화 비활성화

기능: xFormers 라이브러리의 최적화 기능을 비활성화합니다. xFormers는 Transformer 모델의 주의 메커니즘을 최적화하도록 특별히 설계된 라이브러리로, 일반적으로 계산 효율성을 높이고 메모리 사용량을 줄이며 추론 속도를 가속화합니다. 이 최적화를 비활성화하면:
  • 표준 주의 계산 방법으로 돌아갑니다.
  • 메모리 사용량과 계산 시간이 증가할 수 있습니다.
  • 특정 상황에서는 더 안정적인 런타임 환경을 제공합니다.
사용 사례:
  • xFormers 관련 호환성 문제가 발생했을 때
  • 더 정확한 계산 결과가 필요할 때 (일부 최적화가 수치 정밀도에 영향을 줄 수 있음)
  • 디버깅이나 문제 해결을 위해 표준 구현을 사용해야 할 때

모델 파일의 기본 해시 함수

옵션:
  • sha256: SHA-256 알고리즘을 사용하여 해시 검증하며, 높은 보안성이지만 계산 속도가 느립니다.
  • sha1: SHA-1 알고리즘을 사용하며, 빠르지만 보안성이 다소 낮습니다.
  • sha512: SHA-512 알고리즘을 사용하며, 가장 높은 보안성을 제공하지만 계산 속도가 가장 느립니다.
  • md5: MD5 알고리즘을 사용하며, 가장 빠르지만 보안성이 가장 낮습니다.
기능: 모델 파일 검증을 위한 해시 알고리즘을 설정하며, 파일 무결성을 검증하는 데 사용됩니다. 서로 다른 해시 알고리즘은 계산 속도와 보안성 간에 서로 다른 타협점을 제공합니다. 보통 sha256을 기본 옵션으로 사용하는 것이 보안과 성능 간의 좋은 균형을 이루므로 권장됩니다.

PyTorch가 가능한 경우 느린 결정론적 알고리즘 사용

기능: PyTorch가 가능한 경우 결정론적 알고리즘을 사용하도록 강제하며, 결과의 재현성을 향상시킵니다. 설명:
  • 활성화되면 PyTorch는 빠른 비결정론적 알고리즘보다 결정론적 알고리즘을 우선적으로 사용합니다.
  • 동일한 입력은 동일한 출력을 생성하며, 디버깅과 결과 검증에 유용합니다.
  • 결정론적 알고리즘은 일반적으로 비결정론적 알고리즘보다 느립니다.
  • 이 설정이 활성화되어도 모든 상황에서 완벽히 동일한 이미지 결과를 보장할 수는 없습니다.
사용 사례:
  • 엄격한 결과 재현성을 요구하는 과학 연구
  • 안정적인 출력 결과가 필요한 디버깅 과정
  • 결과 일관성을 요구하는 생산 환경

일부 테스트되지 않았으며 품질 저하 가능성이 있는 최적화 활성화

기능: 속도를 향상시킬 수 있지만 생성 품질에 잠재적으로 영향을 줄 수 있는 실험적 최적화를 활성화합니다.

서버 출력을 콘솔에 출력하지 않음

기능: 서버 런타임 정보를 콘솔에 표시하지 않도록 하여 인터페이스를 깔끔하게 유지합니다. 설명:
  • 활성화되면 ComfyUI 서버 로그와 런타임 정보가 표시되지 않습니다.
  • 콘솔 정보의 간섭을 줄여 인터페이스를 더욱 깔끔하게 만들 수 있습니다.
  • 로그 출력이 많을 경우 시스템 성능이 조금 향상될 수 있습니다.
  • 기본값은 비활성화(false)로, 서버 출력이 기본적으로 표시됩니다.
사용 사례:
  • 디버깅 정보가 필요하지 않은 생산 환경
  • 콘솔 인터페이스를 깔끔하게 유지하고 싶을 때
  • 시스템이 안정적으로 작동하고 로그 모니터링이 필요하지 않을 때
참고: 개발 및 디버깅 중에는 이 옵션을 비활성화하여 서버 런타임 상태와 오류 정보를 즉시 확인하는 것이 좋습니다.

프롬프트 메타데이터를 파일에 저장하지 않음

기능: 생성된 이미지에 워크플로우 정보를 저장하지 않으며, 파일 크기를 줄이지만 해당 워크플로우 정보가 손실되어 워크플로우 출력 파일을 사용해 해당 생성 결과를 재현할 수 없게 됩니다.

모든 맞춤형 노드 로드 비활성화

기능: 모든 서드파티 확장 노드를 로드하지 않으며, 주로 문제를 진단해 서드파티 확장 노드가 원인인지 확인할 때 사용됩니다.

로깅 세부정보 수준

기능: 로그 출력의 세부정보 수준을 제어하며, 디버깅과 시스템 런타임 상태 모니터링에 사용됩니다. 옵션:
  • CRITICAL: 프로그램 실행을 중단시킬 수 있는 중요한 오류 정보만 출력합니다.
  • ERROR: 일부 기능이 제대로 작동하지 않는다는 오류 정보를 출력합니다.
  • WARNING: 주요 기능에 영향을 주지 않는 가능성 있는 문제를 나타내는 경고 정보를 출력합니다.
  • INFO: 시스템 런타임 상태와 중요한 작업 기록을 포함한 일반 정보를 출력합니다.
  • DEBUG: 시스템 내부 런타임 세부정보를 포함한 가장 상세한 디버깅 정보를 출력합니다.
설명:
  • 로그 수준은 위에서 아래로 세부정보가 증가합니다.
  • 각 수준은 상위 수준의 모든 로그 정보를 포함합니다.
  • 일반적인 사용에는 INFO 수준으로 설정하는 것이 권장됩니다.
  • 문제 해결 시 더 많은 정보를 얻기 위해 DEBUG 수준으로 설정할 수 있습니다.
  • 생산 환경에서는 로그 양을 줄이기 위해 WARNING 또는 ERROR 수준으로 설정할 수 있습니다.

디렉토리

입력 디렉토리

기능: 입력 파일(예: 이미지, 모델)의 기본 저장 경로를 설정합니다.

출력 디렉토리

기능: 생성 결과의 저장 경로를 설정합니다.