跳转到主要内容
此节点用于支持阿里巴巴万Fun Control视频生成模型,在此提交之后添加。
  • 目的: 使用Wan 2.1 Fun Control模型准备视频生成所需的调节信息。
WanFunControlToVideo节点是ComfyUI的一个扩展,旨在支持Wan Fun Control模型进行视频生成,目标是利用WanFun控制来创建视频。 该节点作为关键调节信息的准备点,并初始化潜在空间的中心点,使用Wan 2.1 Fun模型引导后续的视频生成过程。节点名称清晰地表明了其功能:它接受各种输入,并将其转换为适合在WanFun框架内控制视频生成的格式。 该节点在ComfyUI节点层级中的位置表明,它在视频生成流程的早期阶段运行,专注于在实际采样或解码视频帧之前处理调节信号。

输入

参数名描述是否必需数据类型默认值
正向标准的ComfyUI正向调节数据,通常来自”CLIP Text Encode”节点。正向提示描述了用户期望生成视频的内容、主题和艺术风格。CONDITIONING
负向标准的ComfyUI负向调节数据,通常由”CLIP Text Encode”节点生成。负向提示指定了用户希望在生成视频中避免的元素、风格或伪影。CONDITIONING
vae需要与Wan 2.1 Fun模型系列兼容的VAE(变分自编码器)模型,用于编码和解码图像/视频数据。VAE
宽度输出视频帧的期望宽度(像素),默认值为832,最小值为16,最大值由nodes.MAX_RESOLUTION决定,步长为16。INT832
高度输出视频帧的期望高度(像素),默认值为480,最小值为16,最大值由nodes.MAX_RESOLUTION决定,步长为16。INT480
长度生成视频的总帧数,默认值为81,最小值为1,最大值由nodes.MAX_RESOLUTION决定,步长为4。INT81
批量大小单次批处理生成的视频数量,默认值为1,最小值为1,最大值为4096。INT1
CLIP视觉输出(可选)由CLIP视觉模型提取的视觉特征,用于视觉风格和内容引导。CLIP_VISION_OUTPUT
起始图像(可选)影响生成视频开头的初始图像。IMAGE
控制视频(可选)允许用户提供预处理的ControlNet参考视频,用于引导生成视频的运动和潜在结构。IMAGE

输出

参数名描述数据类型
负向提供增强后的正向调节数据,包含编码后的start_image和control_video。CONDITIONING
latent提供同样经过增强的负向调节数据,包含相同的concat_latent_image。CONDITIONING
latent一个包含空潜在张量的字典,键为”samples”。LATENT
本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑