メインコンテンツへスキップ
このドキュメンテーションは AI によって生成されました。誤りを発見された場合、または改善に関するご提案がある場合は、ぜひご貢献ください! GitHub で編集する
LTXVConcatAVLatent ノードは、動画の潜在表現と音声の潜在表現を単一の、連結された潜在出力に統合します。このノードは、両方の入力から samples テンソルを結合し、存在する場合にはそれらの noise_mask テンソルも同様に結合することで、動画生成パイプラインにおける後続処理の準備を行います。

入力

パラメーターデータ型必須範囲説明
video_latentLATENTはい動画データの潜在表現です。
audio_latentLATENTはい音声データの潜在表現です。
注意: video_latent および audio_latent 入力の samples テンソルが連結されます。いずれかの入力に noise_mask が含まれている場合、そのマスクが使用されます。一方、noise_mask が欠落している入力については、対応する samples と同じ形状を持つ、すべての要素が 1 のマスクが生成されます。その後、これらのマスクも連結されます。

出力

出力名データ型説明
latentLATENT連結された samples を含む単一の潜在辞書です。また、適用可能な場合には、動画および音声入力から得られた連結された noise_mask も含まれます。