WanHuMoImageToVideo - ComfyUI Built-in Node Documentation

WanHuMoImageToVideo 节点通过生成视频帧的潜在表示，将图像转换为视频序列。它处理条件输入，并可结合参考图像和音频嵌入来影响视频生成。该节点输出修改后的条件数据以及适用于视频合成的潜在表示。

参数	描述	数据类型	是否必填	范围
`正面提示词`	正向条件输入，引导视频生成朝向期望内容	CONDITIONING	是	-
`负面提示词`	负向条件输入，引导视频生成远离不期望内容	CONDITIONING	是	-
`VAE`	用于将参考图像编码到潜在空间的 VAE 模型	VAE	是	-
`宽度`	输出视频帧的宽度（像素），默认值：832，必须能被 16 整除	INT	是	16 至 MAX_RESOLUTION
`高度`	输出视频帧的高度（像素），默认值：480，必须能被 16 整除	INT	是	16 至 MAX_RESOLUTION
`长度`	生成视频序列的帧数，默认值：97，必须满足 (length - 1) 能被 4 整除	INT	是	1 至 MAX_RESOLUTION
`批次大小`	同时生成的视频序列数量，默认值：1	INT	是	1 至 4096
`音频编码器输出`	可选的音频编码数据，可根据音频内容影响视频生成	AUDIOENCODEROUTPUT	否	-
`参考图像`	可选的参考图像，用于引导视频生成的风格和内容	IMAGE	否	-

注意： 当提供参考图像时，它会被编码并添加到正向和负向条件中。当提供音频编码器输出时，它会被处理并整合到条件数据中。如果两者均未提供，则参考潜在表示和音频嵌入均使用零填充的占位张量。

本文档由 AI 生成。如果您发现任何错误或有改进建议，欢迎贡献！在 GitHub 上编辑

Source fingerprint (SHA-256): 6301671d04748ce80c561a65df80c7ca146b91bcce8851872df40211af29fd39