输入
| 参数 | 描述 | 数据类型 | 是否必填 | 范围 |
|---|---|---|---|---|
positive | 需要添加修复潜在信息的正向 conditioning | CONDITIONING | 是 | - |
negative | 需要添加修复潜在信息的负向 conditioning | CONDITIONING | 是 | - |
vae | 用于将遮罩和遮罩视频编码到潜在空间的 VAE 模型 | VAE | 是 | - |
video | 源视频帧 [T, H, W, 3] | IMAGE | 是 | - |
quadmask | 来自 VOIDQuadmaskPreprocess 的预处理四重遮罩 [T, H, W] | MASK | 是 | - |
width | 视频和遮罩调整到的宽度(默认值:672) | INT | 是 | 16 至 MAX_RESOLUTION(步长:8) |
height | 视频和遮罩调整到的高度(默认值:384) | INT | 是 | 16 至 MAX_RESOLUTION(步长:8) |
length | 要处理的像素帧数。对于 CogVideoX-Fun-V1.5(patch_size_t=2),latent_t 必须为偶数——导致 latent_t 为奇数的长度将向下取整(例如 49 → 45)(默认值:45) | INT | 是 | 1 至 MAX_RESOLUTION(步长:1) |
batch_size | 输出噪声潜在变量的批次大小(默认值:1) | INT | 是 | 1 至 64 |
输出
| 输出名称 | 描述 | 数据类型 |
|---|---|---|
negative | 已添加修复潜在信息的正向 conditioning | CONDITIONING |
latent | 已添加修复潜在信息的负向 conditioning | CONDITIONING |
latent | 形状为 [batch_size, 16, latent_t, latent_h, latent_w] 的零填充噪声潜在张量 | LATENT |
本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑
Source fingerprint (SHA-256):
a1fe36376d7930286c7a288f261dcf2961d6b13cc412d1a0d42af8a4f9ebeeaf