输入
| 参数 | 描述 | 数据类型 | 是否必填 | 范围 |
|---|---|---|---|---|
音视频潜空间 | 待分离的组合音频-视频潜在表示。 | LATENT | 是 | 不适用 |
samples 张量在第一维度(批次维度)上应至少包含两个元素。第一个元素用于视频潜在表示,第二个元素用于音频潜在表示。如果存在 noise_mask,则会以相同方式拆分。
输出
| 输出名称 | 描述 | 数据类型 |
|---|---|---|
audio_latent | 包含分离后视频数据的潜在表示。 | LATENT |
audio_latent | 包含分离后音频数据的潜在表示。 | LATENT |
本文档由 AI 生成。如果您发现任何错误或有改进建议,欢迎贡献! 在 GitHub 上编辑
Source fingerprint (SHA-256):
55bce5d768e7fe13f885cc32d34ecdac5cdcbb667b03743004866ea4b6d58d46