メインコンテンツへスキップ
このドキュメントはAIによって生成されました。誤りを発見された場合、または改善のご提案がある場合は、ぜひご貢献ください!GitHubで編集する
StableZero123_Conditioning ノードは、入力画像とカメラ角度を処理し、3Dモデル生成に用いる条件データおよび潜在表現(latent representation)を生成します。このノードでは、CLIPビジョンモデルを用いて画像特徴をエンコードし、仰角(elevation)および方位角(azimuth)に基づくカメラ埋め込み情報をそれらと結合します。その結果として、後続の3D生成タスク向けに正の条件データ(positive conditioning)、負の条件データ(negative conditioning)、および潜在表現が生成されます。

入力

パラメーターデータ型必須範囲説明
clip_visionCLIP_VISIONはい-画像特徴をエンコードするために使用されるCLIPビジョンモデル
init_imageIMAGEはい-処理およびエンコード対象の入力画像
vaeVAEはい-ピクセルを潜在空間へエンコードするためのVAEモデル
widthINTいいえ16 ~ MAX_RESOLUTION潜在表現の出力幅(デフォルト:256、8で割り切れる必要があります)
heightINTいいえ16 ~ MAX_RESOLUTION潜在表現の出力高さ(デフォルト:256、8で割り切れる必要があります)
batch_sizeINTいいえ1 ~ 4096バッチ内で生成するサンプル数(デフォルト:1)
elevationFLOATいいえ-180.0 ~ 180.0カメラの仰角(単位:度、デフォルト:0.0)
azimuthFLOATいいえ-180.0 ~ 180.0カメラの方位角(単位:度、デフォルト:0.0)
注意: width および height パラメーターは、ノードが内部でこれらの値を8で除算して潜在表現の次元を算出するため、必ず8で割り切れる値を指定する必要があります。

出力

出力名データ型説明
positiveCONDITIONING画像特徴とカメラ埋め込み情報を統合した正の条件データ
negativeCONDITIONING特徴がゼロ初期化された負の条件データ
latentLATENT次元が [batch_size, 4, height//8, width//8] の潜在表現