LTX-2는 Lightricks가 개발한 190억 파라미터의 DiT 기반 오디오-비디오 베이스모델입니다. 이 모델은 한 번의 처리 과정에서 동기화된 비디오와 오디오를 생성하며, 움직임, 대사, 배경 소음, 음악이 함께 어우러진 일체감 있는 경험을 만들어냅니다.
주요 특징
- 동기화된 오디오-비디오 생성: 한 번의 처리 과정에서 움직임, 대사, 효과음, 음악을 함께 생성합니다.
- 다양한 생성 모드: 텍스트-비디오, 이미지-비디오, 비디오-비디오
- 제어 옵션: IC-LoRAs를 통한 Canny, Depth, Pose 비디오-비디오 제어
- 키프레임 기반 생성: 키프레임 이미지 간 보간 처리
- 네이티브 업스케일링: 더 높은 해상도와 프레임 속도를 위한 공간적(2배) 및 시간적(2배) 업스케일러
- 프롬프트 향상: 자동 프롬프트 향상 지원
모델 체크포인트
| 이름 | 설명 |
|---|---|
| ltx-2-19b-dev | bf16로 된 전체 모델, 유연하고 학습 가능 |
| ltx-2-19b-dev-fp8 | fp8 양자화로 된 전체 모델 |
| ltx-2-19b-distilled | 추출된 버전, 8단계, CFG=1 |
| ltx-2-spatial-upscaler-x2-1.0 | 고해상도를 위한 2배 공간적 업스케일러 |
| ltx-2-temporal-upscaler-x2-1.0 | 더 높은 프레임 속도를 위한 2배 시간적 업스케일러 |
시작하기
LTX-2는 ComfyUI에서 기본적으로 지원됩니다. 시작하려면:- ComfyUI를 최신 버전으로 업데이트하세요.
- 템플릿 라이브러리 > 비디오로 이동한 후, LTX-2 워크플로우 중 하나를 선택하세요.
- 팝업 안내에 따라 모델을 다운로드하고 워크플로우를 실행하세요.
워크플로우
텍스트-비디오
텍스트 프롬프트로부터 비디오를 생성합니다.텍스트-비디오
워크플로우 다운로드
Comfy Cloud에서 실행
클라우드에서 열기
텍스트-비디오 추출
워크플로우 다운로드
이미지-비디오
입력 이미지로부터 비디오를 생성합니다.이미지-비디오
워크플로우 다운로드
Comfy Cloud에서 실행
클라우드에서 열기
이미지-비디오 추출
워크플로우 다운로드
제어-비디오
IC-LoRAs를 이용해 구조적 제어를 통해 비디오를 생성합니다. Depth 제어:Depth-비디오
워크플로우 다운로드
Comfy Cloud에서 실행
클라우드에서 열기
Canny-비디오
워크플로우 다운로드
Comfy Cloud에서 실행
클라우드에서 열기
Pose-비디오
워크플로우 다운로드
Comfy Cloud에서 실행
클라우드에서 열기
프롬프트 작성 팁
LTX-2용 프롬프트를 작성할 때는 행동과 장면에 대한 상세하고 연대기적인 묘사를 중심으로 하세요. 구체적인 움직임, 외관, 카메라 앵글, 환경적 세부사항 등을 한 문장으로 자연스럽게 표현하세요. 바로 행동부터 시작하고 묘사는 직설적이고 정확하게 유지하세요. 프롬프트를 다음과 같은 구조로 작성하세요:- 한 문장으로 된 주요 행동
- 구체적인 움직임과 제스처 설명
- 캐릭터/객체의 외관
- 배경과 환경 세부사항
- 카메라 앵글과 움직임
- 조명과 색상
- 변화나 갑작스러운 사건들