Kandinsky5ImageToVideo - ComfyUI Built-in Node Documentation

Kandinsky5ImageToVideo 节点用于准备 Kandinsky 模型视频生成所需的 conditioning 和潜在空间数据。它会创建一个空的视频潜在张量，并可选择对起始图像进行编码，以引导生成视频的初始帧，同时相应地修改正向和负向 conditioning。

输入

参数	描述	数据类型	是否必填	范围
`正面条件`	引导视频生成的正向 conditioning 提示。	CONDITIONING	是	不适用
`负面条件`	引导视频生成避开特定概念的正向 conditioning 提示。	CONDITIONING	是	不适用
`vae`	用于将可选的起始图像编码到潜在空间的 VAE 模型。	VAE	是	不适用
`宽度`	输出视频的宽度（像素），默认值：768。	INT	否	16 至 8192（步长 16）
`高度`	输出视频的高度（像素），默认值：512。	INT	否	16 至 8192（步长 16）
`时长`	视频的帧数，默认值：121。	INT	否	1 至 8192（步长 4）
`批次大小`	同时生成的视频序列数量，默认值：1。	INT	否	1 至 4096
`初始图象`	可选的起始图像。如果提供，该图像将被编码，并用于替换模型输出潜在变量中的噪声起始部分。	IMAGE	否	不适用

注意： 当提供了 start_image 时，它会自动通过双线性插值调整大小，以匹配指定的 width 和 height。图像批次中的前 length 帧将用于编码。编码后的潜在变量随后会被注入到 positive 和 negative conditioning 中，以引导视频的初始外观。

输出

输出名称	描述	数据类型
`正面条件`	修改后的正向 conditioning，可能已更新编码后的起始图像数据。	CONDITIONING
`负面条件`	修改后的负向 conditioning，可能已更新编码后的起始图像数据。	CONDITIONING
`Latent`	一个填充为零的空视频潜在张量，其形状符合指定的尺寸。	LATENT
`条件Latent`	所提供的起始图像的干净、编码后的潜在表示。内部使用此数据来替换生成视频潜在变量中带噪声的起始部分。	LATENT

本文档由 AI 生成。如果您发现任何错误或有改进建议，欢迎贡献！在 GitHub 上编辑

Source fingerprint (SHA-256): 19d3b60be18f5adcd659563329988bce2511a1b27b33fd0ab3a9d93e265557f2

​输入

​输出

输入

输出