このドキュメントは AI によって生成されました。誤りを発見した場合や改善に関するご提案がありましたら、ぜひご貢献ください! GitHub で編集TextEncodeAceStepAudio1.5 ノードは、AceStepAudio 1.5 モデルで使用するためのテキストおよび音声関連のメタデータを準備します。このノードは、説明的なタグ、歌詞、および音楽パラメーターを受け取り、CLIP モデルを用いてそれらを音声生成に適した条件付け(conditioning)形式に変換します。
入力
| パラメーター | データ型 | 必須 | 範囲 | 説明 |
|---|---|---|---|---|
clip | CLIP | はい | N/A | 入力テキストのトークン化およびエンコーディングに使用される CLIP モデルです。 |
tags | STRING | はい | N/A | 音声のジャンル、ムード、使用楽器などの説明的タグです。複数行入力および動的プロンプトをサポートします。 |
lyrics | STRING | はい | N/A | 音声トラックの歌詞です。複数行入力および動的プロンプトをサポートします。 |
seed | INT | いいえ | 0 ~ 18446744073709551615 | 再現可能な生成のための乱数シード値です。「control_after_generate」ウィジェットが付属しています。デフォルト値:0。 |
bpm | INT | いいえ | 10 ~ 300 | 生成される音声のビート・パー・ミニッツ(BPM)です。デフォルト値:120。 |
duration | FLOAT | いいえ | 0.0 ~ 2000.0 | 生成したい音声の長さ(秒単位)です。デフォルト値:120.0。 |
timesignature | COMBO | いいえ | "2""3""4""6" | 音楽の拍子記号(タイム・シグネチャー)です。 |
language | COMBO | いいえ | "en""ja""zh""es""de""fr""pt""ru""it""nl""pl""tr""vi""cs""fa""id""ko""uk""hu""ar""sv""ro""el" | 入力テキストの言語です。 |
keyscale | COMBO | いいえ | "C major""C minor""C# major""C# minor""Db major""Db minor""D major""D minor""D# major""D# minor""Eb major""Eb minor""E major""E minor""F major""F minor""F# major""F# minor""Gb major""Gb minor""G major""G minor""G# major""G# minor""Ab major""Ab minor""A major""A minor""A# major""A# minor""Bb major""Bb minor""B major""B minor" | 音楽の調性およびスケール(長調または短調)です。 |
generate_audio_codes | BOOLEAN | いいえ | N/A | 音声コードを生成する LLM を有効化します。処理が遅くなる可能性がありますが、生成される音声の品質が向上します。モデルに音声参照を提供する場合は、このオプションを無効にしてください。デフォルト値:True。 |
cfg_scale | FLOAT | いいえ | 0.0 ~ 100.0 | クラシファイアフリー・ガイダンス・スケールです。値が大きいほど、出力がプロンプトに忠実になります。デフォルト値:2.0。 |
temperature | FLOAT | いいえ | 0.0 ~ 2.0 | サンプリング温度です。値が小さいほど、出力が決定論的になります。デフォルト値:0.85。 |
top_p | FLOAT | いいえ | 0.0 ~ 2000.0 | ヌクレウス・サンプリング確率(top-p)です。デフォルト値:0.9。 |
top_k | INT | いいえ | 0 ~ 100 | 考慮対象とする最も高い確率のトークン数(top-k)です。デフォルト値:0。 |
出力
| 出力名 | データ型 | 説明 |
|---|---|---|
CONDITIONING | CONDITIONING | 条件付けデータで、AceStepAudio 1.5 モデル向けにエンコードされたテキストおよび音声パラメーターを含みます。 |