メインコンテンツへスキップ

ComfyUI Depth Anything 3 概要

Depth Anything 3 (DA3) は、ByteDance Seed が開発したビジョントランスフォーマーで、カメラポーズの有無にかかわらず、任意のビジュアル入力から空間的に一貫したジオメトリを復元します。単一の DINO エンコーダと統一された深度-レイ表現により、同一モデルファミリーで単眼深度、多視点深度、カメラポーズ推定、3D 再構築をカバーします。 主な機能:
  • 統一された単眼・多視点深度:単一または複数の画像から深度を推定
  • カメラポーズ推定:順序なし画像セットからカメラ位置を復元
  • 3D 再構築:多視点入力をサポート
  • 動画深度推定:動画入力のフレームごとの深度シーケンスを生成
  • 複数のモデルバリアント:Small、Base、Mono/Metric Large
ComfyUI が最新版に更新されていることを確認してください。このガイドで紹介するワークフローは、ワークフローテンプレートから入手できます。
テンプレート内に該当のワークフローが見つからない場合、ComfyUI のバージョンが古くなっている可能性があります。(デスクトップ版の更新は若干遅れることがあります)
ワークフローを読み込んだ際にノードが欠落している場合の主な原因:
  1. 最新の ComfyUI(Nightly 版)を使用していない
  2. 起動時に一部のノードのインポートに失敗している
ComfyUI は Depth Anything 3 ノードをネイティブサポートしています。始める前に ComfyUI を最新バージョンに更新してください。

モデルインストール

Depth Anything 3 チェックポイントをダウンロードし、対応する ComfyUI フォルダに保存します:
ComfyUI/
├── models/
│   ├── geometry_estimation/
│   │   ├── depth_anything_3_small.safetensors
│   │   ├── depth_anything_3_base.safetensors
│   │   ├── depth_anything_3_mono_large.safetensors
│   │   └── depth_anything_3_metric_large.safetensors

サンプルワークフロー


1. 画像深度推定

機能説明: 1 枚の画像をアップロードし、Image Depth Estimation (Depth Anything 3) を実行して深度マップを生成します。Depth Preview に元画像と深度出力のサイドバイサイド比較が表示されます。

ワークフローをダウンロード

JSON をダウンロード または テンプレートライブラリで “Depth Anything 3” を検索

サンプル画像をダウンロード

このワークフローのサンプル入力画像を取得
画像深度推定出力画像深度推定比較

実行手順

  1. LoadImage — 入力画像を読み込む
  2. LoadDA3Model — Depth Anything 3 バリアントを選択
  3. 実行 — Queue をクリックするか Cmd+Enter を押す
  4. ワークフローが深度マップと並列比較を出力

サブグラフについて

このワークフローはモジュール処理にサブグラフノードを使用しています。サブグラフのカスタマイズと拡張についてはサブグラフのドキュメントをご覧ください。

2. 動画深度推定

機能説明: 動画をアップロードし、Video Depth Estimation (Depth Anything 3) を実行してフレームごとの深度シーケンスを生成します。サブグラフ内では GetVideoComponents が入力動画をフレームに分割し、LoadDA3Model がモデルを読み込み、SetVideoComponents が深度フレームを動画に再構成します。

ワークフローをダウンロード

JSON をダウンロード または テンプレートライブラリで “Depth Anything 3” を検索

Comfy Cloud で実行

Comfy Cloud で開く
動画深度推定プレビュー

実行手順

  1. LoadVideo — 入力動画を読み込む
  2. モデルを選択SmallBaseMono-LargeMetric-Large から選択
  3. 実行 — Queue をクリックするか Cmd+Enter を押す
  4. ワークフローがフレームごとの深度マップ動画を出力

サブグラフについて

このワークフローはモジュール処理にサブグラフノードを使用しています。サブグラフのカスタマイズと拡張についてはサブグラフのドキュメントをご覧ください。

モデルバリアント

バリアントhead_type空検出信頼度カメラデコーダ最適な用途
Smalldualdpt高速推論、モバイル/エッジ
Basedualdptバランスの取れた性能
Mono-Largedpt空検出対応の単眼深度
Metric-Largedptメートル単位の物理深度
  • SmallBasedualdpt ヘッドタイプを使用し、信頼度推定とカメラデコーダをサポート(多視点アプリケーション向け)。
  • Mono-LargeMetric-Largedpt ヘッドタイプを使用し、空検出に対応。Metric-Large はメートル単位の生深度を出力。

コミュニティリソース