LTX-2 は、Lightricks 社による 190 億パラメータの DiT ベースの音声 - 動画基盤モデルです。単一のパスで同期された動画と音声を生成し、動き、会話、背景音、音楽が一緒に作成される一体的な体験を生み出します。
主要機能
- 音声と動画の同期生成: 動き、会話、効果音、音楽を一度のパスで一緒に生成
- 複数の生成モード: テキストから動画、画像から動画、動画から動画に対応
- 制御オプション: IC-LoRAs 経由での Canny、深度、ポーズによる動画から動画制御
- キーフレーム駆動生成: キーフレーム画像間を補間
- ネイティブアップスケーリング: 高解像度と FPS のための空間 (2x) および時間 (2x) アップスケーラー
- プロンプト強化: 自動プロンプト強化サポート
モデルチェックポイント
| 名称 | 説明 |
|---|---|
| ltx-2-19b-dev | bf16 のフルモデル、柔軟で訓練可能 |
| ltx-2-19b-dev-fp8 | fp8 量子化されたフルモデル |
| ltx-2-19b-distilled | 蒸留版、8 ステップ、CFG=1 |
| ltx-2-spatial-upscaler-x2-1.0 | 高解像度のための 2x 空間アップスケーラー |
| ltx-2-temporal-upscaler-x2-1.0 | 高 FPS のための 2x 時間アップスケーラー |
快速入門
LTX-2 は ComfyUI でネイティブサポートされています。開始するには:- ComfyUI を最新バージョンに更新
- テンプレートライブラリ > 動画 > 任意の LTX-2 ワークフローを選択
- ポップアップに従ってモデルをダウンロードし、ワークフローを実行
ワークフロー
テキストから動画
テキストプロンプトから動画を生成します。テキストから動画
ワークフローをダウンロード
Comfy Cloud で実行
クラウドで開く
テキストから動画 蒸留版
ワークフローをダウンロード
画像から動画
入力画像から動画を生成します。画像から動画
ワークフローをダウンロード
Comfy Cloud で実行
クラウドで開く
画像から動画 蒸留版
ワークフローをダウンロード
制御から動画
IC-LoRAs を使用して構造制御付き動画を生成します。 深度制御:深度から動画
ワークフローをダウンロード
Comfy Cloud で実行
クラウドで開く
キャニーから動画
ワークフローをダウンロード
Comfy Cloud で実行
クラウドで開く
ポーズから動画
ワークフローをダウンロード
Comfy Cloud で実行
クラウドで開く
プロンプトのヒント
LTX-2 のプロンプトを作成する際は、アクションやシーンの詳細で時系列な説明に焦点を当ててください。具体的な動き、外見、カメラアングル、環境の詳細を一つの流れるような段落に含めます。アクションから直接始め、説明を文字通りかつ正確に保ってください。 プロンプトの構造:- 一文で主要アクションを描述
- 動きやジェスチャーの詳細
- キャラクター/物体の外見
- 背景と環境の詳細
- カメラアングルと動き
- 照明と色彩
- 変化や突発的なイベント