メインコンテンツへスキップ
LTX-2 は、Lightricks 社による 190 億パラメータの DiT ベースの音声 - 動画基盤モデルです。単一のパスで同期された動画と音声を生成し、動き、会話、背景音、音楽が一緒に作成される一体的な体験を生み出します。
ComfyUI が最新版に更新されていることを確認してください。このガイドで紹介するワークフローは、ワークフローテンプレートから入手できます。
テンプレート内に該当のワークフローが見つからない場合、ComfyUI のバージョンが古くなっている可能性があります。(デスクトップ版の更新は若干遅れることがあります)
ワークフローを読み込んだ際にノードが欠落している場合の主な原因:
  1. 最新の ComfyUI(Nightly 版)を使用していない
  2. 起動時に一部のノードのインポートに失敗している

主要機能

  • 音声と動画の同期生成: 動き、会話、効果音、音楽を一度のパスで一緒に生成
  • 複数の生成モード: テキストから動画、画像から動画、動画から動画に対応
  • 制御オプション: IC-LoRAs 経由での Canny、深度、ポーズによる動画から動画制御
  • キーフレーム駆動生成: キーフレーム画像間を補間
  • ネイティブアップスケーリング: 高解像度と FPS のための空間 (2x) および時間 (2x) アップスケーラー
  • プロンプト強化: 自動プロンプト強化サポート

モデルチェックポイント

名称説明
ltx-2-19b-devbf16 のフルモデル、柔軟で訓練可能
ltx-2-19b-dev-fp8fp8 量子化されたフルモデル
ltx-2-19b-distilled蒸留版、8 ステップ、CFG=1
ltx-2-spatial-upscaler-x2-1.0高解像度のための 2x 空間アップスケーラー
ltx-2-temporal-upscaler-x2-1.0高 FPS のための 2x 時間アップスケーラー

快速入門

LTX-2 は ComfyUI でネイティブサポートされています。開始するには:
  1. ComfyUI を最新バージョンに更新
  2. テンプレートライブラリ > 動画 > 任意の LTX-2 ワークフローを選択
  3. ポップアップに従ってモデルをダウンロードし、ワークフローを実行

ワークフロー

テキストから動画

テキストプロンプトから動画を生成します。

テキストから動画

ワークフローをダウンロード

Comfy Cloud で実行

クラウドで開く
蒸留版(高速、8 ステップ):

テキストから動画 蒸留版

ワークフローをダウンロード

画像から動画

入力画像から動画を生成します。

画像から動画

ワークフローをダウンロード

Comfy Cloud で実行

クラウドで開く
蒸留版(高速、8 ステップ):

画像から動画 蒸留版

ワークフローをダウンロード

制御から動画

IC-LoRAs を使用して構造制御付き動画を生成します。 深度制御:

深度から動画

ワークフローをダウンロード

Comfy Cloud で実行

クラウドで開く
キャニー制御:

キャニーから動画

ワークフローをダウンロード

Comfy Cloud で実行

クラウドで開く
ポーズ制御:

ポーズから動画

ワークフローをダウンロード

Comfy Cloud で実行

クラウドで開く

プロンプトのヒント

LTX-2 のプロンプトを作成する際は、アクションやシーンの詳細で時系列な説明に焦点を当ててください。具体的な動き、外見、カメラアングル、環境の詳細を一つの流れるような段落に含めます。アクションから直接始め、説明を文字通りかつ正確に保ってください。 プロンプトの構造:
  • 一文で主要アクションを描述
  • 動きやジェスチャーの詳細
  • キャラクター/物体の外見
  • 背景と環境の詳細
  • カメラアングルと動き
  • 照明と色彩
  • 変化や突発的なイベント
最適な結果を得るために、プロンプトは 200 語以内に収めてください。

リソース