输入
| 参数 | 描述 | 数据类型 | 必填 | 范围 |
|---|---|---|---|---|
clip视觉 | 用于编码图像特征的 CLIP 视觉模型 | CLIP_VISION | 是 | - |
初始图像 | 待处理和编码的输入图像 | IMAGE | 是 | - |
vae | 用于将像素编码到潜在空间的 VAE 模型 | VAE | 是 | - |
宽度 | 潜在表示的输出宽度(默认值:256,必须能被 8 整除) | INT | 是 | 16 至 MAX_RESOLUTION |
高度 | 潜在表示的输出高度(默认值:256,必须能被 8 整除) | INT | 是 | 16 至 MAX_RESOLUTION |
批量大小 | 批次中生成的样本数量(默认值:1) | INT | 是 | 1 至 4096 |
俯仰角 | 相机仰角(度)(默认值:0.0) | FLOAT | 是 | -180.0 至 180.0 |
方位角 | 相机方位角(度)(默认值:0.0) | FLOAT | 是 | -180.0 至 180.0 |
width 和 height 参数必须能被 8 整除,因为节点会自动将它们除以 8 来创建潜在表示的维度。
输出
| 输出名称 | 描述 | 数据类型 |
|---|---|---|
负面条件 | 结合图像特征和相机嵌入的正向条件数据 | CONDITIONING |
Latent | 使用零初始化特征的负向条件数据 | CONDITIONING |
latent | 维度为 [batch_size, 4, height//8, width//8] 的潜在表示 | LATENT |
本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑
Source fingerprint (SHA-256):
a9d6619c800119c9a619665f322d49ded1478ceb40df56ca5707b31242cb0e47