メインコンテンツへスキップ
Cosmos-Predict2 は、NVIDIA が開発した次世代の物理世界向け基礎モデルであり、物理AIシナリオにおける高品質な視覚生成および予測タスクに特化して設計されています。
このモデルは、卓越した物理的正確性、環境との相互作用能力、および細部の再現性能を備えており、複雑な物理現象や動的なシーンをリアルにシミュレートすることが可能です。
Cosmos-Predict2 は、テキストから画像へ(Text-to-Image)や動画から3Dワールドへ(Video-to-World)など、さまざまな生成手法をサポートしており、産業用シミュレーション、自動運転、都市計画、科学研究などの分野で広く活用されています。 GitHub: Cosmos-predict2
Hugging Face: Cosmos-Predict2
本ガイドでは、ComfyUI における テキストから画像へ(Text-to-Image) のワークフローの実行手順を解説します。 動画生成に関するセクションについては、以下のリンクをご参照ください:

Cosmos Predict2 動画生成

Cosmos-Predict2 を用いた動画生成
Make sure your ComfyUI is updated.Workflows in this guide can be found in the Workflow Templates. If you can’t find them in the template, your ComfyUI may be outdated. (Desktop version’s update will delay sometime)If nodes are missing when loading a workflow, possible reasons:
  1. You are not using the latest ComfyUI version (Nightly version)
  2. Some nodes failed to import at startup