跳转到主要内容

概述

此节点为 AR(自回归)视频模型准备图像到视频的生成配置。它接收起始图像,使用 VAE 将其编码到潜在空间中,并将编码后的图像存储在模型配置中。这使得视频采样过程能够将该图像用作第一帧,从而在不依赖独立图像到视频模型架构的情况下有效引导生成过程。

输入

参数描述数据类型必填范围
模型用于生成的 AR 视频模型。MODEL-
vae用于将起始图像编码到潜在空间的 VAE 模型。VAE-
起始图像将作为生成视频第一帧的初始图像。IMAGE-
宽度生成视频帧的宽度(默认值:832)。INT16 至 8192(步长:16)
高度生成视频帧的高度(默认值:480)。INT16 至 8192(步长:16)
长度生成视频的总帧数(默认值:81)。INT1 至 1024(步长:4)
批量大小单批次生成的视频序列数量(默认值:1)。INT1 至 64

输出

输出名称描述数据类型
MODEL克隆后的模型,其配置中存储了编码后的起始图像,用于视频生成。MODEL
LATENT一个空的潜在张量,其维度与视频生成过程相匹配。LATENT
本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑

Source fingerprint (SHA-256): 0445b279ba49fa946050cfa70d1e6b13240eaa600b99dfe63f27c3203dc4b61b