このドキュメントはAIによって生成されました。誤りを発見された場合、または改善のご提案がある場合は、ぜひご貢献ください!GitHubで編集するStableZero123_Conditioning ノードは、入力画像とカメラ角度を処理し、3Dモデル生成に用いる条件データおよび潜在表現(latent representation)を生成します。このノードでは、CLIPビジョンモデルを用いて画像特徴をエンコードし、仰角(elevation)および方位角(azimuth)に基づくカメラ埋め込み情報をそれらと結合します。その結果として、後続の3D生成タスク向けに正の条件データ(positive conditioning)、負の条件データ(negative conditioning)、および潜在表現が生成されます。
入力
| パラメーター | データ型 | 必須 | 範囲 | 説明 |
|---|---|---|---|---|
clip_vision | CLIP_VISION | はい | - | 画像特徴をエンコードするために使用されるCLIPビジョンモデル |
init_image | IMAGE | はい | - | 処理およびエンコード対象の入力画像 |
vae | VAE | はい | - | ピクセルを潜在空間へエンコードするためのVAEモデル |
width | INT | いいえ | 16 ~ MAX_RESOLUTION | 潜在表現の出力幅(デフォルト:256、8で割り切れる必要があります) |
height | INT | いいえ | 16 ~ MAX_RESOLUTION | 潜在表現の出力高さ(デフォルト:256、8で割り切れる必要があります) |
batch_size | INT | いいえ | 1 ~ 4096 | バッチ内で生成するサンプル数(デフォルト:1) |
elevation | FLOAT | いいえ | -180.0 ~ 180.0 | カメラの仰角(単位:度、デフォルト:0.0) |
azimuth | FLOAT | いいえ | -180.0 ~ 180.0 | カメラの方位角(単位:度、デフォルト:0.0) |
width および height パラメーターは、ノードが内部でこれらの値を8で除算して潜在表現の次元を算出するため、必ず8で割り切れる値を指定する必要があります。
出力
| 出力名 | データ型 | 説明 |
|---|---|---|
positive | CONDITIONING | 画像特徴とカメラ埋め込み情報を統合した正の条件データ |
negative | CONDITIONING | 特徴がゼロ初期化された負の条件データ |
latent | LATENT | 次元が [batch_size, 4, height//8, width//8] の潜在表現 |