跳转到主要内容

Documentation Index

Fetch the complete documentation index at: https://docs.comfy.org/llms.txt

Use this file to discover all available pages before exploring further.

本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑

概述

此节点为 AR(自回归)视频模型准备图像到视频的生成配置。它接收起始图像,使用 VAE 将其编码到潜在空间中,并将编码后的图像存储在模型配置中。这使得视频采样过程能够将该图像用作第一帧,从而在不依赖独立图像到视频模型架构的情况下有效引导生成过程。

输入

参数数据类型必填范围描述
模型MODEL-用于生成的 AR 视频模型。
vaeVAE-用于将起始图像编码到潜在空间的 VAE 模型。
起始图像IMAGE-将作为生成视频第一帧的初始图像。
宽度INT16 至 8192(步长:16)生成视频帧的宽度(默认值:832)。
高度INT16 至 8192(步长:16)生成视频帧的高度(默认值:480)。
长度INT1 至 1024(步长:4)生成视频的总帧数(默认值:81)。
批量大小INT1 至 64单批次生成的视频序列数量(默认值:1)。

输出

输出名称数据类型描述
MODELMODEL克隆后的模型,其配置中存储了编码后的起始图像,用于视频生成。
LATENTLATENT一个空的潜在张量,其维度与视频生成过程相匹配。

Source fingerprint (SHA-256): 0445b279ba49fa946050cfa70d1e6b13240eaa600b99dfe63f27c3203dc4b61b