跳转到主要内容

Documentation Index

Fetch the complete documentation index at: https://docs.comfy.org/llms.txt

Use this file to discover all available pages before exploring further.

本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑

## 概述

对单张图像运行 MoGe 模型以估计深度和几何结构。此节点通过 MoGe 模型处理输入图像,生成 3D 点云、深度图、相机内参、遮罩以及表面法线。

## 输入

参数数据类型是否必需范围描述
moge_modelMOGE_MODEL不适用用于推理的 MoGe 模型。
imageIMAGE不适用用于深度和几何估计的输入图像。
resolution_levelINT0 到 9控制处理分辨率。0 最快,9 提供最精细的细节。(默认值:9)
fov_x_degreesFLOAT0.0 到 170.0源相机的水平视场角(单位:度)。设置用于将深度图反投影到 3D 的焦距。设为 0.0 可从预测点自动恢复视场角。(默认值:0.0)
batch_sizeINT1 到 64每次推理调用处理的图像数量。处理长视频或大型图像集时,若内存不足,可降低此值。(默认值:4)
force_projectionBOOLEANTrue/False(高级)强制对预测点进行投影。(默认值:True)
apply_maskBOOLEANTrue/False启用时,将遮罩区域(天空或无效像素)在点和深度输出中设为无穷大。这有助于网格化工具忽略这些区域。禁用时,保留所有位置的原始预测几何结构;遮罩仍会单独返回。(默认值:True)

## 输出

输出名称数据类型描述
moge_geometryMOGE_GEOMETRY包含估计几何结构的字典。其中包括原始 image,并可能包含 points(3D 点云)、depth(深度图)、intrinsics(相机内参矩阵)、mask(标识有效像素的遮罩)以及 normal(表面法线)。

Source fingerprint (SHA-256): 5213b280513850eeef2e22ae723ebb015789109435e28ddd79f91f9a4b4a1e79