- 端到端角色动画:用驱动视频的运动驱动静态角色图像
- 两种模式:动画模式(角色执行动作)和替换模式(将跟踪人物替换为参考角色)
- 长视频支持:基于分段的重叠帧扩展生成
- 内置 ComfyUI 节点:使用原生
WanSCAILToVideo、SCAIL2ColoredMask和SAM3跟踪,无需额外自定义节点,仅需下载标准模型即可
SCAIL-2 角色替换工作流
在 Comfy Cloud 中运行
在 Comfy Cloud 中打开
下载工作流
下载 JSON 或在模板库中搜索 “SCAIL-2”
工作流原理
本工作流使用两个子图节点——Base 子图(第一段)和 Extend 子图(后续段落)——来支持短视频和长视频的角色动画。- 加载驱动视频(
pose_video)和参考角色图像 - Base 子图处理第一段(默认 81 帧)
- Extend 子图处理第 2 段及后续,将上一段的
previous_frames链接起来 - 预览结果并保存
了解 Subgraph 子图
本工作流使用 Subgraph 节点进行模块化处理。查看子图文档了解如何自定义和扩展工作流。
长视频
对于较长的视频,计算段落数量:ceil(total_frames / 76)。除第一段外均使用 Extend 子图。复制 Extend 节点以增加更多段落,链接 previous_frames 输出,并递增 segment_index。
注意: WanSCAILToVideo 无法自动排队所有段落——需要手动运行每个段落。
两种模式
| 模式 | replace_mode | 驱动视频蒙版背景 | 说明 |
|---|---|---|---|
| 替换模式 | true(默认) | 白色 | 将驱动视频中跟踪的人物替换为参考角色 |
| 动画模式 | false | 黑色 | 参考角色执行驱动视频的动作 |
replace_mode 参数。
输入和参数
共用参数(Base 和 Extend)
| 参数 | 说明 |
|---|---|
pose_video | 要传递动作的驱动视频 |
reference_image | 要动画化或插入的角色图像 |
prompt | 输出视频描述 |
replace_mode | true = 替换模式,false = 动画模式 |
segment_index | 1 为第一段,2+ 为延续。姿态偏移 = 76 × (索引 − 1) |
width / height | 输出分辨率,例如 896×512。必须能被 16 整除 |
frame_count | 每段帧数(默认:81) |
previous_frame_count | 段落间的重叠帧数(默认:5) |
pose_strength / pose_start / pose_end | 姿态条件的强度和时间范围 |
SAM3 跟踪(两个输入)
sam3_video_object 和 sam3_image_object 输入控制 SAM3 蒙版跟踪——不是 SCAIL-2 的输出提示词。它们确定彩色蒙版跟踪哪些对象:
| 输入 | 目标 | 输出 |
|---|---|---|
sam3_video_object | 驱动视频 | pose_video_mask |
sam3_image_object | 参考图像 | reference_image_mask |
- 使用开放式文本描述(默认:
human) - 当视频和参考中的目标相同时使用相同的描述
- 如果视频和参考需要不同的关注点(例如拥挤场景),使用不同的描述
模型安装
首先将 ComfyUI 更新到最新版本,以获取内置的 WanSCAILToVideo 和 SCAIL2ColoredMask 节点。所需模型
diffusion_models text_encoders(选择其一) clip_vision vae loras- lightx2v_I2V_14B_480p_cfg_step_distill_rank64_bf16.safetensors
- wan2.1_SCAIL_2_DPO_lora_bf16.safetensors