메인 콘텐츠로 건너뛰기
StableZero123_Conditioning 노드는 입력 이미지와 카메라 각도를 처리하여 3D 모델 생성을 위한 컨디셔닝 데이터와 잠재 표현을 생성합니다. CLIP 비전 모델을 사용하여 이미지 특징을 인코딩하고, 고도 및 방위각을 기반으로 한 카메라 임베딩 정보와 결합하여 양성 및 음성 컨디셔닝과 함께 다운스트림 3D 생성 작업을 위한 잠재 표현을 생성합니다.

입력

매개변수설명데이터 타입필수범위
clip_vision이미지 특징을 인코딩하는 데 사용되는 CLIP 비전 모델CLIP_VISION-
초기 이미지처리 및 인코딩할 입력 이미지IMAGE-
vae픽셀을 잠재 공간으로 인코딩하는 데 사용되는 VAE 모델VAE-
너비잠재 표현의 출력 너비 (기본값: 256, 8로 나누어 떨어져야 함)INT16 ~ MAX_RESOLUTION
높이잠재 표현의 출력 높이 (기본값: 256, 8로 나누어 떨어져야 함)INT16 ~ MAX_RESOLUTION
배치 크기배치에서 생성할 샘플 수 (기본값: 1)INT1 ~ 4096
고도카메라 고도 각도 (도 단위, 기본값: 0.0)FLOAT-180.0 ~ 180.0
방위각카메라 방위각 (도 단위, 기본값: 0.0)FLOAT-180.0 ~ 180.0
참고: widthheight 매개변수는 8로 나누어 떨어져야 합니다. 노드가 잠재 표현 차원을 생성하기 위해 자동으로 이 값을 8로 나누기 때문입니다.

출력

출력 이름설명데이터 타입
부정 조건이미지 특징과 카메라 임베딩을 결합한 양성 컨디셔닝 데이터CONDITIONING
잠재 데이터0으로 초기화된 특징을 가진 음성 컨디셔닝 데이터CONDITIONING
latent[batch_size, 4, height//8, width//8] 차원의 잠재 표현LATENT
이 문서는 AI에 의해 생성되었습니다. 오류를 발견하거나 개선 제안이 있으시면 기여해 주세요! GitHub에서 편집

Source fingerprint (SHA-256): a9d6619c800119c9a619665f322d49ded1478ceb40df56ca5707b31242cb0e47