跳转到主要内容

Documentation Index

Fetch the complete documentation index at: https://docs.comfy.org/llms.txt

Use this file to discover all available pages before exploring further.

TripoSplat 是一款开源模型,能够从单张 2D 图片直接生成 3D 高斯泼溅(Gaussian splat) 表示。由 VAST-AI 开发,以开源许可证发布。 与传统需要多视角输入或主要生成网格的 3D 重建方法不同,TripoSplat 创建 高斯泼溅 表示——一种将数千个带颜色的 3D 高斯体分布在空间中来表示场景的渲染技术。这种方法可以实现快速、高质量的渲染,并支持可控密度和预算。 TripoSplat 工作流
请确保你的 ComfyUI 已经更新。本指南里的工作流可以在 ComfyUI 的工作流模板中找到。如果找不到,可能是 ComfyUI 没有更新。如果加载工作流时有节点缺失,可能原因有:
  1. 你用的不是最新开发版(nightly)。
  2. 你用的是稳定版或桌面版(没有包含最新的更新)。
  3. 启动时有些节点导入失败。

下载工作流

下载 JSON 或在模板库中搜索 “TripoSplat”

工作原理

TripoSplat 使用 前馈架构,接收单张 RGB 图像并直接预测一组 3D 高斯基元。流程包括:
  1. 图像编码 — 输入图像由视觉编码器(DINOv2)处理
  2. 三平面生成 — 特征解码为三平面表示
  3. 高斯预测 — 采样三平面以生成高斯参数(位置、缩放、旋转、不透明度、颜色)
  4. 渲染 — 通过可微分泼溅从任意视角渲染高斯体

了解子图

本工作流使用子图节点进行模块化处理。查看子图文档了解如何自定义和扩展工作流。

工作流节点指南

LoadImage

  • 加载输入图片(PNG/JPG)
  • 示例图片:white-hotel-on-rocky-island.png(可在模板库中获取)

TripoSplat(子图)

主处理子图节点,接收图片并生成 3D 高斯泼溅。暴露的参数:
参数默认值说明
switch启用/禁用子图
num_gaussians生成的高斯基元数量(控制质量/性能)
seed随机种子,用于结果复现
unet_nameTripoSplat 扩散模型检查点
clip_nameCLIP 视觉编码器模型
vae_name用于编码/解码的 VAE 模型(两个:一个为主 VAE,一个为编码器)
bg_removal_name背景去除模型

CreateCameraInfo

  • 定义渲染结果的相机轨道
  • 参数:轨道类型、角度、距离、视野等
  • 默认:35° 仰角、距离 30、缩放 2.5

RenderSplat

  • 从定义的相机角度将高斯泼溅渲染为 2D 图像
  • 参数:输出分辨率(默认 1024×1024)、图像质量设置

SplatToMesh

  • 将高斯泼溅转换为网格(可选)
  • 参数:网格密度、平滑度、简化程度

SaveGLB

  • 将结果保存为 GLB 3D 文件

SaveVideo

  • 保存渲染 3D 场景的视频

SplatToFile3D

  • 以 SPZ 格式导出高斯泼溅

CreateVideo

  • 从渲染帧创建视频

运行步骤

  1. 加载图片 — 使用 LoadImage 节点加载一张 2D 图片
  2. 运行 TripoSplat 子图 — 模型将生成高斯泼溅表示
  3. 选择输出格式 — 导出为 GLB、SPZ、视频或渲染为网格
  4. 查看结果 — 使用生成的 3D 文件或渲染预览

输出选项

节点格式用途
SaveGLB.glb标准 3D 文件格式,可导入 3D 软件
SplatToFile3D.spz压缩的高斯泼溅格式,高效存储
RenderSplat2D 图像从任意角度快速预览结果
SplatToMesh网格转换为传统网格以供进一步编辑

模型下载

下载 TripoSplat 模型及所需文件。放入对应的 models/ 子目录。

TripoSplat 扩散模型

triposplat_fp16.safetensors — TripoSplat 扩散模型检查点

TripoSplat VAE 解码器

triposplat_vae_decoder_fp16.safetensors — VAE 解码器

Flux2 VAE

flux2-vae.safetensors — Flux.2 VAE,用于潜空间编码

DINOv2 CLIP

dino_v3_vit_h.safetensors — CLIP 视觉编码器(DINOv2)

BiRefNet 背景去除

birefnet.safetensors — 用于预处理的背景去除模型

模型存放位置

📂 ComfyUI/
├── 📂 models/
│   ├── 📂 diffusion_models/
│   │      └── triposplat_fp16.safetensors
│   ├── 📂 vae/
│   │      ├── triposplat_vae_decoder_fp16.safetensors
│   │      └── flux2-vae.safetensors
│   ├── 📂 clip_vision/
│   │      └── dino_v3_vit_h.safetensors
│   └── 📂 background_removal/
│          └── birefnet.safetensors