ComfyUI Wan2.1 Fun Camera 官方原生示例
本文介绍了如何在 ComfyUI 中使用 Wan2.1 Fun Camera 完成视频生成
关于 Wan2.1 Fun Camera
Wan2.1 Fun Camera 是阿里团队推出的视频生成项目,专注于通过摄像机运动来控制视频生成效果。
模型权重下载地址:
代码仓库:VideoX-Fun
目前 ComfyUI 已原生支持了 Wan2.1 Fun Camera 模型。
如果在加载下面的工作流文件时,你发现存在节点缺失,可能是因为以下情况:
- 你使用的 ComfyUI 版本不是最新的开发(nightly)版本。
- 你使用的 ComfyUI 版本是稳定(release)版本或桌面版(desktop)版本(不包含最新的功能更新)。
- 你使用的 ComfyUI 版本是最新的 commit 版本,但在启动过程中部分节点导入失败了。
请先确保你已经成功更新 ComfyUI 到最新的开发(nightly)版本, 请查看:如何更新 ComfyUI 部分了解如何更新 ComfyUI。
相关模型安装
这些模型你仅需要安装一次,另外在对应的工作流图片中也包含了模型下载信息,你可以选择你喜欢的方式下载模型。
下面的所有模型你可以在 Wan_2.1_ComfyUI_repackaged 找到
Diffusion Models 选择 1.3B 或 14B:
下面的模型,如果你使用过 Wan2.1 的相关模型,那么你应该已经有了下面的模型,如果没有,请下载下面的模型:
Text Encoders 选择其中一个:
VAE
CLIP Vision
文件保存位置:
ComfyUI Wan2.1 Fun Camera 1.3B 原生工作流示例
1. 工作流相关文件下载
1.1 工作流文件
下载下面的视频,并拖入 ComfyUI 中以加载对应的工作流:
下载 Json 格式工作流文件
如果你想使用 14B 版本,只需要将模型文件替换为 14B 版本即可,但请注意显存要求。
1.2 输入图片下载
请下载下面的图片,我们将作为起始帧:
2. 按步骤完成工作流
- 确保加载了正确版本的模型文件:
- 1.3B 版本:
wan2.1_fun_camera_v1.1_1.3B_bf16.safetensors
- 14B 版本:
wan2.1_fun_camera_v1.1_14B_bf16.safetensors
- 1.3B 版本:
- 确保
Load CLIP
节点加载了umt5_xxl_fp8_e4m3fn_scaled.safetensors
- 确保
Load VAE
节点加载了wan_2.1_vae.safetensors
- 确保
Load CLIP Vision
节点加载了clip_vision_h.safetensors
- 在
Load Image
节点上传起始帧 - 修改 Prompt,如果你使用了你自己的图像输入
- 在
WanCameraEmbedding
节点设置相机动作 - 点击
Run
按钮,或使用快捷键Ctrl(cmd) + Enter(回车)
执行生成
ComfyUI Wan2.1 Fun Camera 14B 工作流及输入图片
下载 Json 格式工作流文件
输入图片
性能参考
1.3B 版本:
- 512×512 RTX 4090 生成 81 帧约需 72 秒
14B 版本:
- RTX4090 24GB 显存在生成 512×512 分辨率时可能会出现显存不足, 在 A100 上运行尺寸过大时也出现过显存不足的情况