メインコンテンツへスキップ
Cosmos-Predict2 は、NVIDIA によって開発された次世代の物理世界基礎モデルであり、物理 AI シナリオにおける高品質な視覚生成および予測タスクのために特別に設計されています。 このモデルは、卓越した物理的正確性、環境相互作用性、および詳細再現能力を特徴とし、複雑な物理現象や動的シーンの現実的なシミュレーションを可能にします。 Cosmos-Predict2 は、テキストから画像(Text2Image)や動画から世界へ(Video2World)など、さまざまな生成方法をサポートしており、産業シミュレーション、自動運転、都市計画、科学研究などの分野で広く使用されています。 これは、インテリジェントビジョンと物理世界の深い統合を促進するための重要な基礎ツールです。 GitHub:Cosmos-predict2 huggingface: Cosmos-Predict2 このガイドでは、ComfyUI での Video2World 生成の完了までの手順を説明します。 テキストから画像のセクションについては、以下の部分を参照してください。

Cosmos Predict2 テキストから画像

Cosmos-Predict2 を使用したテキストから画像の生成