このモデルは、卓越した物理的正確性、環境との相互作用能力、および細部の再現性能を備えており、複雑な物理現象や動的なシーンをリアルにシミュレートすることが可能です。 Cosmos-Predict2 は、テキストから画像へ(Text-to-Image)や動画から3Dワールドへ(Video-to-World)など、さまざまな生成手法をサポートしており、産業用シミュレーション、自動運転、都市計画、科学研究などの分野で広く活用されています。 GitHub: Cosmos-predict2
Hugging Face: Cosmos-Predict2 本ガイドでは、ComfyUI における テキストから画像へ(Text-to-Image) のワークフローの実行手順を解説します。 動画生成に関するセクションについては、以下のリンクをご参照ください:
Cosmos Predict2 動画生成
Cosmos-Predict2 を用いた動画生成