跳转到主要内容
Kandinsky5ImageToVideo 节点用于准备 Kandinsky 模型视频生成所需的 conditioning 和潜在空间数据。它会创建一个空的视频潜在张量,并可选择对起始图像进行编码,以引导生成视频的初始帧,同时相应地修改正向和负向 conditioning。

输入

参数描述数据类型是否必填范围
正面条件引导视频生成的正向 conditioning 提示。CONDITIONING不适用
负面条件引导视频生成避开特定概念的正向 conditioning 提示。CONDITIONING不适用
vae用于将可选的起始图像编码到潜在空间的 VAE 模型。VAE不适用
宽度输出视频的宽度(像素),默认值:768。INT16 至 8192(步长 16)
高度 输出视频的高度(像素),默认值:512。INT16 至 8192(步长 16)
时长视频的帧数,默认值:121。INT1 至 8192(步长 4)
批次大小同时生成的视频序列数量,默认值:1。INT1 至 4096
初始图象可选的起始图像。如果提供,该图像将被编码,并用于替换模型输出潜在变量中的噪声起始部分。IMAGE不适用
注意: 当提供了 start_image 时,它会自动通过双线性插值调整大小,以匹配指定的 widthheight。图像批次中的前 length 帧将用于编码。编码后的潜在变量随后会被注入到 positivenegative conditioning 中,以引导视频的初始外观。

输出

输出名称描述数据类型
负面条件修改后的正向 conditioning,可能已更新编码后的起始图像数据。CONDITIONING
Latent修改后的负向 conditioning,可能已更新编码后的起始图像数据。CONDITIONING
条件Latent一个填充为零的空视频潜在张量,其形状符合指定的尺寸。LATENT
cond_latent所提供的起始图像的干净、编码后的潜在表示。内部使用此数据来替换生成视频潜在变量中带噪声的起始部分。LATENT
本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑

Source fingerprint (SHA-256): 19d3b60be18f5adcd659563329988bce2511a1b27b33fd0ab3a9d93e265557f2