Grok Imagine Video 1.5 画像から動画 ComfyUI 公式例

Grok Imagine Video 1.5 Partner Node は、1 枚の画像からネイティブオーディオ付きの高品質動画を生成します。xAI の最新 Grok モデルを搭載し、最大 1080p の解像度をサポートします。ノードは model パラメータで 2 つのモデルバリアントを選択できます：

grok-imagine-video — 従来モデル、画像入力はオプション
grok-imagine-video-1.5 — 最新モデル、常に入力画像が必要、1080p 出力対応

両バリアントともネイティブオーディオを生成し、効果音、環境音、会話が同一推論パスで合成されるため、別途オーディオパイプラインは不要です。動画の長さは 1 秒から 15 秒の範囲です。

APIノードを使用するには、正しくログインしていることと、許可されたネットワーク環境で使用していることを確認する必要があります。APIノードの使用に必要な具体的な要件については、ドキュメントの「APIノードの概要」セクションをご参照ください。

ポータブル版または自宅サーバーで実行しているユーザー
デスクトップ版またはクラウド版ユーザー

ComfyUI が最新版に更新されていることを確認してください。

このガイドで紹介するワークフローは、ワークフローテンプレートから入手できます。
テンプレート内に該当のワークフローが見つからない場合、ComfyUI のバージョンが古くなっている可能性があります。（デスクトップ版の更新は若干遅れることがあります）ワークフローを読み込んだ際にノードが欠落している場合の主な原因：

最新の ComfyUI（Nightly 版）を使用していない
起動時に一部のノードのインポートに失敗している

Grok Imagine Video 1.5: 画像から動画

Comfy Cloud で実行

Comfy Cloud を開く

ワークフローをダウンロード

JSON をダウンロード、またはテンプレートライブラリで “Grok Imagine Video 1.5” を検索

ワークフローの概要

このワークフローは 3 つのノードで構成されます：

LoadImage — 開始画像フレームを提供
GrokVideoNode — grok-imagine-video-1.5 モデルに設定された核心ノード
SaveVideo — 生成されたネイティブオーディオ付き動画を保存

実行手順

開始画像をアップロード — LoadImage ノードで参照画像を読み込み
プロンプトを入力 — GrokVideoNode で動き、雰囲気、シーンのダイナミクスを説明
モデルを選択 — grok-imagine-video-1.5 が選択されていることを確認
解像度を設定 — 出力解像度を選択（720p 推奨）
長さを設定 — 動画の秒数を選択
シードを設定 — 結果の再現性を制御
実行 — Ctrl+Enter で生成

出力

生成された動画には動きと同期したネイティブオーディオが含まれ、SaveVideo ノードで自動保存されます。

ヒント

高品質の入力画像を使用すると最良の結果が得られます
視覚シーンと動きのダイナミクスの両方をプロンプトで説明すると効果的です
シード値を変えることで多様な結果が得られます

​Grok Imagine Video 1.5: 画像から動画

Comfy Cloud で実行

ワークフローをダウンロード

​ワークフローの概要

​実行手順

​出力

​ヒント

Grok Imagine Video 1.5: 画像から動画

ワークフローの概要

実行手順

出力

ヒント