跳转到主要内容
WanCameraImageToVideo 节点通过生成用于视频生成的潜在表示,将图像转换为视频序列。它处理条件化输入和可选的起始图像,以创建可用于视频模型的视频潜在表示。该节点支持相机条件和剪辑视觉输出,以增强视频生成控制。

输入

参数描述数据类型是否必需范围
正面提示词用于视频生成的正面条件化提示CONDITIONING-
负面提示词视频生成中需避免的负面条件化提示CONDITIONING-
VAE用于将图像编码到潜在空间的 VAE 模型VAE-
宽度输出视频宽度(像素)(默认值:832,步长:16)INT16 至 MAX_RESOLUTION
高度输出视频高度(像素)(默认值:480,步长:16)INT16 至 MAX_RESOLUTION
长度视频序列中的帧数(默认值:81,步长:4)INT1 至 MAX_RESOLUTION
批次大小同时生成的视频数量(默认值:1)INT1 至 4096
CLIP视觉输出可选的 CLIP 视觉输出,用于额外的条件化CLIP_VISION_OUTPUT-
起始图像可选的起始图像,用于初始化视频序列。提供时,视频的前几帧将基于此图像,并应用遮罩将起始帧与生成内容混合。图像会被调整大小以匹配指定的宽度和高度。IMAGE-
相机条件可选的相机嵌入条件,用于视频生成。提供时,这些条件会同时应用于正面和负面条件化。WAN_CAMERA_EMBEDDING-
注意: 当提供 start_image 时,节点会使用它来初始化视频序列,并应用遮罩将起始帧与生成内容混合。camera_conditionsclip_vision_output 参数是可选的,但提供时,它们会修改正面和负面提示的条件化。

输出

输出名称描述数据类型
负面提示词应用了相机条件和剪辑视觉输出后的修改版正面条件化CONDITIONING
潜空间应用了相机条件和剪辑视觉输出后的修改版负面条件化CONDITIONING
latent生成的视频潜在表示,用于视频模型。潜在张量的维度为 [batch_size, 16, frames, height/8, width/8],其中 frames 的计算方式为 ((length - 1) // 4) + 1。LATENT
本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑

Source fingerprint (SHA-256): 19d76097d580b14663afd0aab58810f9dc1685cd32e8f67aa43c820be65239e7