메인 콘텐츠로 건너뛰기

StableZero123_Conditioning_Batched

StableZero123_Conditioning_Batched 노드는 입력 이미지를 처리하여 3D 모델 생성을 위한 컨디셔닝 데이터를 생성합니다. CLIP 비전과 VAE 모델을 사용하여 이미지를 인코딩한 후, 고도(elevation) 및 방위각(azimuth) 각도를 기반으로 카메라 임베딩을 생성하여 배치 처리를 위한 양성 및 음성 컨디셔닝과 잠재 표현을 생성합니다.

입력

매개변수설명데이터 타입필수 여부범위
clip_vision입력 이미지 인코딩에 사용되는 CLIP 비전 모델CLIP_VISION-
초기 이미지처리 및 인코딩할 초기 입력 이미지IMAGE-
vae이미지 픽셀을 잠재 공간으로 인코딩하는 데 사용되는 VAE 모델VAE-
너비처리된 이미지의 출력 너비 (기본값: 256, 8로 나누어 떨어져야 함)INT아니요16 ~ MAX_RESOLUTION
높이처리된 이미지의 출력 높이 (기본값: 256, 8로 나누어 떨어져야 함)INT아니요16 ~ MAX_RESOLUTION
배치 크기배치에서 생성할 컨디셔닝 샘플 수 (기본값: 1)INT아니요1 ~ 4096
고도초기 카메라 고도 각도(도) (기본값: 0.0)FLOAT아니요-180.0 ~ 180.0
방위각초기 카메라 방위각 각도(도) (기본값: 0.0)FLOAT아니요-180.0 ~ 180.0
고도 배치 증가각 배치 항목에 대해 고도를 증가시킬 값 (기본값: 0.0)FLOAT아니요-180.0 ~ 180.0
방위각 배치 증가각 배치 항목에 대해 방위각을 증가시킬 값 (기본값: 0.0)FLOAT아니요-180.0 ~ 180.0
참고: widthheight 매개변수는 8로 나누어 떨어져야 합니다. 이 노드는 내부적으로 잠재 공간 생성을 위해 이러한 차원을 8로 나누기 때문입니다.

출력

출력 이름설명데이터 타입
부정 조건이미지 임베딩과 카메라 매개변수를 포함하는 양성 컨디셔닝 데이터CONDITIONING
잠재 데이터0으로 초기화된 임베딩을 포함하는 음성 컨디셔닝 데이터CONDITIONING
latent배치 인덱싱 정보와 함께 처리된 이미지의 잠재 표현LATENT
이 문서는 AI에 의해 생성되었습니다. 오류를 발견하거나 개선 제안이 있으시면 기여해 주세요! GitHub에서 편집

Source fingerprint (SHA-256): 2b770f7a168a0d3e33da8bfa63383080709fa5d53846dbf6a4374bd1ef1746aa