このドキュメンテーションは AI によって生成されました。誤りを発見された場合、または改善に関するご提案がある場合は、ぜひご貢献ください! GitHub で編集するLTXVConcatAVLatent ノードは、動画の潜在表現と音声の潜在表現を単一の、連結された潜在出力に統合します。このノードは、両方の入力から
samples テンソルを結合し、存在する場合にはそれらの noise_mask テンソルも同様に結合することで、動画生成パイプラインにおける後続処理の準備を行います。
入力
| パラメーター | データ型 | 必須 | 範囲 | 説明 |
|---|---|---|---|---|
video_latent | LATENT | はい | 動画データの潜在表現です。 | |
audio_latent | LATENT | はい | 音声データの潜在表現です。 |
video_latent および audio_latent 入力の samples テンソルが連結されます。いずれかの入力に noise_mask が含まれている場合、そのマスクが使用されます。一方、noise_mask が欠落している入力については、対応する samples と同じ形状を持つ、すべての要素が 1 のマスクが生成されます。その後、これらのマスクも連結されます。
出力
| 出力名 | データ型 | 説明 |
|---|---|---|
latent | LATENT | 連結された samples を含む単一の潜在辞書です。また、適用可能な場合には、動画および音声入力から得られた連結された noise_mask も含まれます。 |