메인 콘텐츠로 건너뛰기
Cosmos-Predict2는 NVIDIA의 차세대 물리 세계 기반 모델로, 물리적 AI 시나리오에서 고품질 시각 생성 및 예측 작업을 위해 특별히 설계되었습니다.
이 모델은 뛰어난 물리적 정확성, 환경 상호작용성, 세부 묘사 능력을 갖추고 있어 복잡한 물리 현상과 동적 장면을 사실적으로 시뮬레이션할 수 있습니다.
Cosmos-Predict2는 텍스트-to-이미지(Text2Image)와 비디오-to-월드(Video2World)를 포함한 다양한 생성 방식을 지원하며, 산업 시뮬레이션, 자율주행, 도시 계획, 과학 연구 등 다양한 분야에서 널리 사용되고 있습니다.
이는 지능형 비전과 물리 세계의 심도 있는 통합을 촉진하는 핵심 기초 도구입니다.
GitHub: Cosmos-predict2 huggingface: Cosmos-Predict2 이 가이드에서는 ComfyUI에서 Video2World 생성을 완료하는 과정을 안내합니다. 텍스트-to-이미지 섹션에 대해서는 다음 부분을 참고해 주세요:

Cosmos Predict2 텍스트-to-이미지

Cosmos-Predict2를 이용한 텍스트-to-이미지 생성