HunyuanVideo15ImageToVideo - ComfyUI Built-in Node Documentation

HunyuanVideo15ImageToVideo 节点基于 HunyuanVideo 1.5 模型，为视频生成准备条件嵌入和潜在空间数据。它会为视频序列创建一个初始潜在表示，并可选择性地集成起始图像或 CLIP 视觉输出，以引导生成过程。

输入

参数	描述	数据类型	是否必填	范围
`正面条件`	正向条件提示，描述视频应包含的内容。	CONDITIONING	是	-
`负面条件`	负向条件提示，描述视频应避免的内容。	CONDITIONING	是	-
`vae`	用于将起始图像编码到潜在空间的 VAE（变分自编码器）模型。	VAE	是	-
`宽度`	输出视频帧的宽度（像素）。必须能被 16 整除。（默认值：848）	INT	否	16 到 MAX_RESOLUTION
`高度`	输出视频帧的高度（像素）。必须能被 16 整除。（默认值：480）	INT	否	16 到 MAX_RESOLUTION
`帧数`	视频序列的总帧数。必须是 4 的倍数。（默认值：33）	INT	否	1 到 MAX_RESOLUTION
`批次大小`	单批次生成的视频序列数量。（默认值：1）	INT	否	1 到 4096
`图像`	可选的起始图像，用于初始化视频生成。如果提供，它将被编码并用于约束前几帧。仅使用图像的前 `帧数` 帧。	IMAGE	否	-
`CLIP视觉输出`	可选的 CLIP 视觉嵌入，为生成过程提供额外的视觉条件。	CLIP_VISION_OUTPUT	否	-

注意： 当提供了 start_image 时，它会使用双线性插值自动调整大小，以匹配指定的 width 和 height。将使用图像批次的前 length 帧。然后，编码后的图像会作为 concat_latent_image 连同对应的 concat_mask 添加到 positive 和 negative 条件中。对于起始图像覆盖的帧，掩码设置为 0.0；对于剩余帧，掩码设置为 1.0。

输出

输出名称	描述	数据类型
`正面条件`	修改后的正向条件，现在可能包含编码后的起始图像或 CLIP 视觉输出。	CONDITIONING
`负面条件`	修改后的负向条件，现在可能包含编码后的起始图像或 CLIP 视觉输出。	CONDITIONING
`latent`	一个空的潜在张量，其维度已根据指定的批次大小、视频长度、宽度和高度进行配置。	LATENT

本文档由 AI 生成。如果您发现任何错误或有改进建议，欢迎贡献！在 GitHub 上编辑

Source fingerprint (SHA-256): 2f41bbb080672683fb1755be575f08c79ca03e324df66953eb40631581197d47

​输入

​输出

输入

输出