서버 구성 - ComfyUI

The settings described on this page are located in the ComfyUI in-app settings menu. You can open it by navigating to Settings (gear icon) or using the Ctrl + , keyboard shortcut, then select the corresponding category to view and configure these options.

현재 서버 구성 설정 메뉴는 데스크톱 버전에만 존재하며, 다른 버전에는 이 설정 메뉴 항목이 없습니다.

네트워크

호스트: 수신할 IP 주소

기능: 서버가 바인딩할 IP 주소를 설정합니다. 기본값 127.0.0.1은 로컬 접속만 허용됨을 의미합니다. LAN 접속이 필요하다면 0.0.0.0으로 설정할 수 있습니다.

데스크톱 버전에서는 LAN 수신 설정을 제공하지만, 데스크톱 애플리케이션으로서 서버로 사용하기에는 적합하지 않습니다. LAN 내에서 ComfyUI를 공공 서비스로 사용해야 한다면, 매뉴얼 배포 튜토리얼을 참고해 해당 ComfyUI 서비스를 배포하시기를 권장합니다.

포트: 수신할 포트

기능: 서버가 수신하는 포트 번호입니다. 데스크톱 버전의 기본 포트는 8000이며, 웹 버전은 일반적으로 8188 포트를 사용합니다.

TLS 키 파일: HTTPS용 TLS 키 파일 경로

기능: HTTPS 암호화에 필요한 개인 키 파일 경로로, 안전한 연결을 구축하는 데 사용됩니다.

TLS 인증서 파일: HTTPS용 TLS 인증서 파일 경로

기능: HTTPS 암호화에 필요한 인증서 파일 경로로, 개인 키와 함께 사용됩니다.

CORS 헤더 활성화: 모든 출처에 ”*” 사용 또는 도메인 지정

기능: 크로스 오리진 리소스 공유 설정으로, 웹 브라우저가 다른 도메인에서 서버에 접근할 수 있도록 합니다.

최대 업로드 크기(MB)

기능: 단일 파일 업로드의 최대 크기를 MB 단위로 제한하며, 기본값은 100MB입니다. 이미지, 모델 및 기타 파일의 업로드 제한에 영향을 줍니다.

CUDA

사용할 CUDA 장치 인덱스

기능: 사용할 NVIDIA 그래픽 카드를 지정합니다. 0은 첫 번째 그래픽 카드를 나타내며, 1은 두 번째를 나타냅니다. 멀티 GPU 시스템에서 중요합니다.

메모리 할당에 CUDA malloc 사용

기능: CUDA의 메모리 할당자를 사용할지 여부를 제어합니다. 특정 상황에서 메모리 관리 효율성을 높일 수 있습니다.

추론

글로벌 부동소수점 정밀도

기능: 모델 계산의 숫자 정밀도를 설정합니다. FP16은 VRAM을 절약하지만 품질에 영향을 줄 수 있으며, FP32는 더 정확하지만 더 많은 VRAM을 사용합니다.

UNET 정밀도

옵션:

auto: 가장 적합한 정밀도를 자동으로 선택합니다.
fp64: 64비트 부동소수점 정밀도로, 가장 높은 정밀도이지만 VRAM 사용량이 가장 많습니다.
fp32: 32비트 부동소수점 정밀도로, 표준 정밀도입니다.
fp16: 16비트 부동소수점 정밀도로, VRAM을 절약할 수 있습니다.
bf16: 16비트 브레인 부동소수점 정밀도로, fp16과 fp32 사이에 위치합니다.
fp8_e4m3fn: 8비트 부동소수점 정밀도(e4m3)로, VRAM 사용량이 가장 적습니다.
fp8_e5m2: 8비트 부동소수점 정밀도(e5m2)로, VRAM 사용량이 가장 적습니다.

기능: 확산 모델의 UNET 핵심 구성 요소의 계산 정밀도를 구체적으로 제어합니다. 높은 정밀도는 더 나은 이미지 생성 품질을 제공하지만 더 많은 VRAM을 사용합니다. 낮은 정밀도는 VRAM을 크게 절약할 수 있지만 생성 결과의 품질에 영향을 줄 수 있습니다.

VAE 정밀도

옵션 및 권장 사항:

auto: 가장 적합한 정밀도를 자동으로 선택하며, 8~12GB VRAM을 가진 사용자에게 권장합니다.
fp16: 16비트 부동소수점 정밀도로, 6GB 이하 VRAM을 가진 사용자에게 권장되며, VRAM을 절약할 수 있지만 품질에 영향을 줄 수 있습니다.
fp32: 32비트 부동소수점 정밀도로, 16GB 이상 VRAM을 가진 사용자 중 최고 품질을 추구하는 경우 권장됩니다.
bf16: 16비트 브레인 부동소수점 정밀도로, 이 형식을 지원하는 최신 그래픽 카드에 권장되며, 더 나은 성능 균형을 얻을 수 있습니다.

기능: 변분 오토인코더(VAE)의 계산 정밀도를 제어하며, 이미지 인코딩/디코딩의 품질과 속도에 영향을 줍니다. 높은 정밀도는 더 나은 이미지 복원 품질을 제공하지만 더 많은 VRAM을 사용합니다. 낮은 정밀도는 VRAM을 절약할 수 있지만 이미지 디테일 복원에 영향을 줄 수 있습니다.

CPU에서 VAE 실행

기능: VAE를 CPU에서 강제로 실행하도록 하며, VRAM을 절약할 수 있지만 처리 속도가 저하됩니다.

텍스트 인코더 정밀도

옵션:

auto: 가장 적합한 정밀도를 자동으로 선택합니다.
fp8_e4m3fn: 8비트 부동소수점 정밀도(e4m3)로, VRAM 사용량이 가장 적습니다.
fp8_e5m2: 8비트 부동소수점 정밀도(e5m2)로, VRAM 사용량이 가장 적습니다.
fp16: 16비트 부동소수점 정밀도로, VRAM을 절약할 수 있습니다.
fp32: 32비트 부동소수점 정밀도로, 표준 정밀도입니다.

기능: 텍스트 프롬프트 인코더의 계산 정밀도를 제어하며, 텍스트 이해의 정확성과 VRAM 사용량에 영향을 줍니다. 높은 정밀도는 더 정확한 텍스트 이해를 제공하지만 더 많은 VRAM을 사용합니다. 낮은 정밀도는 VRAM을 절약할 수 있지만 프롬프트 파싱의 효과에 영향을 줄 수 있습니다.

메모리

채널-마지막 메모리 형식 강제 적용

기능: 메모리 내 데이터 배열을 변경하며, 특정 하드웨어에서 성능을 향상시킬 수 있습니다.

DirectML 장치 인덱스

기능: Windows에서 DirectML 가속을 사용할 때 장치를 지정하며, 주로 AMD 그래픽 카드에 사용됩니다.

IPEX 최적화 비활성화

기능: Intel CPU 최적화를 비활성화하며, 주로 Intel 프로세서 성능에 영향을 줍니다.

VRAM 관리 모드

옵션:

auto: VRAM을 자동으로 관리하며, 모델 크기와 요구사항에 따라 VRAM을 할당합니다.
lowvram: 저용량 VRAM 모드로, 최소한의 VRAM을 사용하며 생성 품질에 영향을 줄 수 있습니다.
normalvram: 표준 VRAM 모드로, VRAM 사용량과 성능 간의 균형을 맞춥니다.
highvram: 고용량 VRAM 모드로, 더 나은 성능을 위해 더 많은 VRAM을 사용합니다.
novram: VRAM을 전혀 사용하지 않으며, 전적으로 시스템 메모리에서 실행합니다.
cpu: 그래픽 카드를 사용하지 않고 CPU 전용 모드입니다.

기능: VRAM 사용 전략을 제어하며, 자동 관리, 저용량 VRAM 모드 등을 선택할 수 있습니다.

예약된 VRAM(GB)

기능: 운영체제와 다른 프로그램을 위해 예약된 VRAM의 양으로, 시스템 동결을 방지합니다.

스마트 메모리 관리 비활성화

기능: 자동 메모리 최적화를 비활성화하며, 모델이 VRAM을 해방하기 위해 시스템 메모리로 이동하도록 강제합니다.

미리보기

잠재 미리보기에 사용되는 방법

옵션:

none: 미리보기 이미지를 표시하지 않으며, 생성 중 진행률 막대만 표시합니다.
auto: 가장 적합한 미리보기 방법을 자동으로 선택하며, 시스템 성능과 VRAM에 따라 동적으로 조정합니다.
latent2rgb: 잠재 공간 데이터를 바로 RGB 이미지로 변환하여 미리보기하며, 속도는 빠르지만 품질은 평균적입니다.
taesd: 경량 TAESD 모델을 사용하여 미리보기하며, 속도와 품질 간의 균형을 맞춥니다.

기능: 생성 중 중간 결과를 어떻게 미리보기할지 제어합니다. 서로 다른 미리보기 방법은 미리보기 품질과 성능 소모에 영향을 줍니다. 적절한 미리보기 방법을 선택하면 미리보기 효과와 시스템 자원 사용 간의 균형을 찾을 수 있습니다.

미리보기 이미지의 크기

기능: 미리보기 이미지의 해상도를 설정하며, 미리보기 선명도와 성능에 영향을 줍니다. 큰 크기는 더 높은 미리보기 품질을 제공하지만 더 많은 VRAM을 소모합니다.

캐시

클래식 캐시 시스템 사용

기능: 전통적인 캐싱 전략을 사용하며, 보다 보수적이지만 안정적입니다.

최대 N개 노드 결과를 캐시하는 LRU 캐싱 사용

기능: 최근 사용되지 않은(LRU) 알고리즘 캐싱 시스템을 사용하며, 지정된 수의 노드 계산 결과를 캐시할 수 있습니다. 설명:

특정 숫자를 설정하여 최대 캐시 개수를 제어하며, 예를 들어 10, 50, 100 등으로 설정할 수 있습니다.
캐싱을 통해 동일한 노드 연산의 반복 계산을 피할 수 있어 워크플로우 실행 속도를 향상시킵니다.
캐시가 한계에 도달하면 자동으로 가장 오래된 결과를 삭제합니다.
캐시된 결과는 시스템 메모리(RAM/VRAM)를 차지하며, 값이 클수록 더 많은 메모리를 사용합니다.

사용 권장 사항:

기본값은 null로, LRU 캐싱이 비활성화됨을 의미합니다.
시스템 메모리 용량과 사용 요구사항에 따라 적절한 캐시 개수를 설정하세요.
같은 노드 구성이 자주 재사용되는 워크플로우에 권장됩니다.
시스템 메모리가 충분하다면 더 큰 값을 설정하여 성능 향상을 기대할 수 있습니다.

주의

크로스 주의 방법

옵션:

auto: 가장 적합한 주의 계산 방법을 자동으로 선택합니다.
split: 블록별 주의 계산으로, VRAM을 절약할 수 있지만 속도는 느립니다.
quad: 쿼드 주의 알고리즘을 사용하며, 속도와 VRAM 사용량 간의 균형을 맞춥니다.
pytorch: PyTorch 기본 주의 계산을 사용하며, 속도는 빠르지만 VRAM 사용량이 높습니다.

기능: 모델이 주의를 계산할 때 사용하는 특정 알고리즘을 제어합니다. 서로 다른 알고리즘은 생성 품질, 속도, VRAM 사용량 간에 서로 다른 타협점을 제공합니다. 보통 auto를 사용하여 자동 선택하는 것이 좋습니다.

주의 상승 강제

기능: 고정밀 주의 계산을 강제하며, 품질을 향상시키지만 VRAM 사용량을 증가시킵니다.

주의 상승 방지

기능: 고정밀 주의 계산을 비활성화하며, VRAM을 절약합니다.

일반

xFormers 최적화 비활성화

기능: xFormers 라이브러리의 최적화 기능을 비활성화합니다. xFormers는 Transformer 모델의 주의 메커니즘을 최적화하도록 특별히 설계된 라이브러리로, 일반적으로 계산 효율성을 높이고 메모리 사용량을 줄이며 추론 속도를 가속화합니다. 이 최적화를 비활성화하면:

표준 주의 계산 방법으로 돌아갑니다.
메모리 사용량과 계산 시간이 증가할 수 있습니다.
특정 상황에서는 더 안정적인 런타임 환경을 제공합니다.

사용 사례:

xFormers 관련 호환성 문제가 발생했을 때
더 정확한 계산 결과가 필요할 때 (일부 최적화가 수치 정밀도에 영향을 줄 수 있음)
디버깅이나 문제 해결을 위해 표준 구현을 사용해야 할 때

모델 파일의 기본 해시 함수

옵션:

sha256: SHA-256 알고리즘을 사용하여 해시 검증하며, 높은 보안성이지만 계산 속도가 느립니다.
sha1: SHA-1 알고리즘을 사용하며, 빠르지만 보안성이 다소 낮습니다.
sha512: SHA-512 알고리즘을 사용하며, 가장 높은 보안성을 제공하지만 계산 속도가 가장 느립니다.
md5: MD5 알고리즘을 사용하며, 가장 빠르지만 보안성이 가장 낮습니다.

기능: 모델 파일 검증을 위한 해시 알고리즘을 설정하며, 파일 무결성을 검증하는 데 사용됩니다. 서로 다른 해시 알고리즘은 계산 속도와 보안성 간에 서로 다른 타협점을 제공합니다. 보통 sha256을 기본 옵션으로 사용하는 것이 보안과 성능 간의 좋은 균형을 이루므로 권장됩니다.

PyTorch가 가능한 경우 느린 결정론적 알고리즘 사용

기능: PyTorch가 가능한 경우 결정론적 알고리즘을 사용하도록 강제하며, 결과의 재현성을 향상시킵니다. 설명:

활성화되면 PyTorch는 빠른 비결정론적 알고리즘보다 결정론적 알고리즘을 우선적으로 사용합니다.
동일한 입력은 동일한 출력을 생성하며, 디버깅과 결과 검증에 유용합니다.
결정론적 알고리즘은 일반적으로 비결정론적 알고리즘보다 느립니다.
이 설정이 활성화되어도 모든 상황에서 완벽히 동일한 이미지 결과를 보장할 수는 없습니다.

사용 사례:

엄격한 결과 재현성을 요구하는 과학 연구
안정적인 출력 결과가 필요한 디버깅 과정
결과 일관성을 요구하는 생산 환경

일부 테스트되지 않았으며 품질 저하 가능성이 있는 최적화 활성화

기능: 속도를 향상시킬 수 있지만 생성 품질에 잠재적으로 영향을 줄 수 있는 실험적 최적화를 활성화합니다.

서버 출력을 콘솔에 출력하지 않음

기능: 서버 런타임 정보를 콘솔에 표시하지 않도록 하여 인터페이스를 깔끔하게 유지합니다. 설명:

활성화되면 ComfyUI 서버 로그와 런타임 정보가 표시되지 않습니다.
콘솔 정보의 간섭을 줄여 인터페이스를 더욱 깔끔하게 만들 수 있습니다.
로그 출력이 많을 경우 시스템 성능이 조금 향상될 수 있습니다.
기본값은 비활성화(false)로, 서버 출력이 기본적으로 표시됩니다.

사용 사례:

디버깅 정보가 필요하지 않은 생산 환경
콘솔 인터페이스를 깔끔하게 유지하고 싶을 때
시스템이 안정적으로 작동하고 로그 모니터링이 필요하지 않을 때

참고: 개발 및 디버깅 중에는 이 옵션을 비활성화하여 서버 런타임 상태와 오류 정보를 즉시 확인하는 것이 좋습니다.

프롬프트 메타데이터를 파일에 저장하지 않음

기능: 생성된 이미지에 워크플로우 정보를 저장하지 않으며, 파일 크기를 줄이지만 해당 워크플로우 정보가 손실되어 워크플로우 출력 파일을 사용해 해당 생성 결과를 재현할 수 없게 됩니다.

모든 맞춤형 노드 로드 비활성화

기능: 모든 서드파티 확장 노드를 로드하지 않으며, 주로 문제를 진단해 서드파티 확장 노드가 원인인지 확인할 때 사용됩니다.

로깅 세부정보 수준

기능: 로그 출력의 세부정보 수준을 제어하며, 디버깅과 시스템 런타임 상태 모니터링에 사용됩니다. 옵션:

CRITICAL: 프로그램 실행을 중단시킬 수 있는 중요한 오류 정보만 출력합니다.
ERROR: 일부 기능이 제대로 작동하지 않는다는 오류 정보를 출력합니다.
WARNING: 주요 기능에 영향을 주지 않는 가능성 있는 문제를 나타내는 경고 정보를 출력합니다.
INFO: 시스템 런타임 상태와 중요한 작업 기록을 포함한 일반 정보를 출력합니다.
DEBUG: 시스템 내부 런타임 세부정보를 포함한 가장 상세한 디버깅 정보를 출력합니다.

설명:

로그 수준은 위에서 아래로 세부정보가 증가합니다.
각 수준은 상위 수준의 모든 로그 정보를 포함합니다.
일반적인 사용에는 INFO 수준으로 설정하는 것이 권장됩니다.
문제 해결 시 더 많은 정보를 얻기 위해 DEBUG 수준으로 설정할 수 있습니다.
생산 환경에서는 로그 양을 줄이기 위해 WARNING 또는 ERROR 수준으로 설정할 수 있습니다.

디렉토리

입력 디렉토리

기능: 입력 파일(예: 이미지, 모델)의 기본 저장 경로를 설정합니다.

출력 디렉토리

기능: 생성 결과의 저장 경로를 설정합니다.

About 페이지

워크플로우 공유하기

​네트워크

​호스트: 수신할 IP 주소

​포트: 수신할 포트

​TLS 키 파일: HTTPS용 TLS 키 파일 경로

​TLS 인증서 파일: HTTPS용 TLS 인증서 파일 경로

​CORS 헤더 활성화: 모든 출처에 ”*” 사용 또는 도메인 지정

​최대 업로드 크기(MB)

​CUDA

​사용할 CUDA 장치 인덱스

​메모리 할당에 CUDA malloc 사용

​추론

​글로벌 부동소수점 정밀도

​UNET 정밀도

​VAE 정밀도

​CPU에서 VAE 실행

​텍스트 인코더 정밀도

​메모리

​채널-마지막 메모리 형식 강제 적용

​DirectML 장치 인덱스

​IPEX 최적화 비활성화

​VRAM 관리 모드

​예약된 VRAM(GB)

​스마트 메모리 관리 비활성화

​미리보기

​잠재 미리보기에 사용되는 방법

​미리보기 이미지의 크기

​캐시

​클래식 캐시 시스템 사용

​최대 N개 노드 결과를 캐시하는 LRU 캐싱 사용

​주의

​크로스 주의 방법

​주의 상승 강제

​주의 상승 방지

​일반

​xFormers 최적화 비활성화

​모델 파일의 기본 해시 함수

​PyTorch가 가능한 경우 느린 결정론적 알고리즘 사용

​일부 테스트되지 않았으며 품질 저하 가능성이 있는 최적화 활성화

​서버 출력을 콘솔에 출력하지 않음

​프롬프트 메타데이터를 파일에 저장하지 않음

​모든 맞춤형 노드 로드 비활성화

​로깅 세부정보 수준

​디렉토리

​입력 디렉토리

​출력 디렉토리

네트워크

호스트: 수신할 IP 주소

포트: 수신할 포트

TLS 키 파일: HTTPS용 TLS 키 파일 경로

TLS 인증서 파일: HTTPS용 TLS 인증서 파일 경로

CORS 헤더 활성화: 모든 출처에 ”*” 사용 또는 도메인 지정

최대 업로드 크기(MB)

CUDA

사용할 CUDA 장치 인덱스

메모리 할당에 CUDA malloc 사용

추론

글로벌 부동소수점 정밀도

UNET 정밀도

VAE 정밀도

CPU에서 VAE 실행

텍스트 인코더 정밀도

메모리

채널-마지막 메모리 형식 강제 적용

DirectML 장치 인덱스

IPEX 최적화 비활성화

VRAM 관리 모드

예약된 VRAM(GB)

스마트 메모리 관리 비활성화

미리보기

잠재 미리보기에 사용되는 방법

미리보기 이미지의 크기

캐시

클래식 캐시 시스템 사용

최대 N개 노드 결과를 캐시하는 LRU 캐싱 사용

주의

크로스 주의 방법

주의 상승 강제

주의 상승 방지

일반

xFormers 최적화 비활성화

모델 파일의 기본 해시 함수

PyTorch가 가능한 경우 느린 결정론적 알고리즘 사용

일부 테스트되지 않았으며 품질 저하 가능성이 있는 최적화 활성화

서버 출력을 콘솔에 출력하지 않음

프롬프트 메타데이터를 파일에 저장하지 않음

모든 맞춤형 노드 로드 비활성화

로깅 세부정보 수준

디렉토리

입력 디렉토리

출력 디렉토리