メインコンテンツへスキップ
このドキュメンテーションはAIによって生成されました。誤りを発見した場合や改善のご提案がある場合は、ぜひご貢献ください! GitHubで編集する
TextEncodeAceStepAudio ノードは、タグと歌詞をトークンに統合し、可変の歌詞強度でエンコードすることで、音声条件付け用のテキスト入力を処理します。このノードは CLIP モデルおよびテキスト説明(タグ)と歌詞を受け取り、これらを統合してトークン化し、音声生成タスクに適した条件付けデータを生成します。また、歌詞が最終出力に与える影響を制御する「歌詞強度」パラメーターを用いて、歌詞の影響力を微調整できます。

入力

パラメーターデータ型必須範囲説明
clipCLIPはい-トークン化およびエンコーディングに使用される CLIP モデル
tagsSTRINGはい-音声条件付け用のテキストタグまたは説明(複数行入力および動的プロンプトをサポート)
lyricsSTRINGはい-音声条件付け用の歌詞テキスト(複数行入力および動的プロンプトをサポート)
lyrics_strengthFLOATいいえ0.0 – 10.0条件付け出力における歌詞の影響強度を制御します(デフォルト値:1.0、ステップ:0.01)

出力

出力名データ型説明
conditioningCONDITIONING処理済みテキストトークンを含み、歌詞強度が適用されたエンコード済み条件付けデータ