MediaPipe は Google のオープンソース機械学習ソリューションで、リアルタイム認識を実現します。ComfyUI では、MediaPipe Face Detection が BlazeFace 検出、FaceMesh v2 ランドマーク推定、ARKit-52 blendshape を単一の統合ワークフローで提供します。 MediaPipe Face Detection は ComfyUI にネイティブ対応しています(PR #14009)。モデルウェイトは Apache 2.0 License のもとで提供されています。 MediaPipe GitHub | Comfy-Org Model RepositoryDocumentation Index
Fetch the complete documentation index at: https://docs.comfy.org/llms.txt
Use this file to discover all available pages before exploring further.
主な機能
- 高速顔検出 — BlazeFace ベースの検出器、近距離(約 2 m)と遠距離(約 5 m)のバリアント
- 478 の顔ランドマーク — 検出された顔ごとの高密度 FaceMesh v2 キーポイント
- ARKit-52 blendshape — リアルタイムの表情係数
- 顔領域マスク — 顔の輪郭、唇、目、虹彩の領域別マスク
- 顔境界ボックス —
DrawBBoxesノードと互換性のある出力で境界ボックス可視化が可能
対象範囲: 顔検出のみ — BlazeFace + FaceMesh v2 + ARKit blendshape。手、姿勢、全身検出は含まれません。
MediaPipe Face Detection ワークフロー
1. ワークフローのダウンロード
ComfyUI を最新バージョンにアップデートし、Workflow → Browse Templates に移動して、Utility カテゴリから “Mediapipe: Image Face Detection” を探してください。
ワークフローのJSONをダウンロード
ワークフローをダウンロード
Comfy Cloud で実行
クラウドで開く
サンプル画像をダウンロード
このワークフローの入力サンプル画像を取得
2. モデルのダウンロード
MediaPipe Face Detection モデルは Comfy-Org MediaPipe model repository でホストされています。 以下のディレクトリ構造に配置してください:3. ワークフローの使用方法
このワークフローは subgraph(サブグラフ)ノードを使用して、顔検出、可視化、マスク生成を調整します。サブグラフは以下の制御パラメータを公開しています:Subgraph について
このワークフローは Subgraph ノードを使用したモジュール処理を採用しています。Subgraph のドキュメントを参照して、ワークフローのカスタマイズと拡張方法を学んでください。
| 入力 | 説明 |
|---|---|
| image | 解析する入力画像バッチ |
| face_landmarker | オプション。空の場合は内蔵モデルローダーを使用。外部 FACE_DETECTION_MODEL 出力を接続して上書き可能 |
| パラメータ | デフォルト | 説明 |
|---|---|---|
| model_name | mediapipe_face_fp32.safetensors | ComfyUI/models/detection/ 内のチェックポイント。不足している場合は上記のモデルをダウンロード |
| detector_variant | short | short — 近距離/大きな顔向けに調整(約 2 m)。full — より小さい/遠い顔もカバー(約 5 m)、低速。both — 両方の検出器を実行し、フレームごとにより多くの顔を見つけた方を採用(約 2 倍のコスト) |
| num_faces | 1 | フレームごとに返す最大顔数。0 = 制限なし(検出されたすべてを返す)。範囲:0–16 |
| custom_face_oval | false | マスク出力に顔の輪郭領域を含める |
| custom_lips | false | マスクに唇を含める(他の有効領域と結合) |
| custom_left_eye | false | マスクに左目領域を含める |
| custom_right_eye | false | マスクに右目領域を含める |
| custom_irises | false | マスクに虹彩領域を含める |
| 出力 | タイプ | 説明 |
|---|---|---|
| face_landmarks | FACE_LANDMARKS | フレームごとの顔データ。478 の 2D/3D ランドマーク、ARKit-52 blendshape、メッシュトポロジデータを含む — 可視化ノードとマスクノードに供給 |
| bboxes | BOUNDING_BOX | 顔境界ボックス — DrawBBoxes ノードと互換 |
| mask | MASK | 有効な領域切り替えから生成されたバイナリマスク |
4. ワークフローの実行
- モデルファイルが
ComfyUI/models/detection/に配置されていることを確認 Load Imageノードで画像を読み込み- 必要に応じて検出パラメータを調整
QueueをクリックするかCtrl(Cmd) + Enterで実行- ワークフローはメッシュオーバーレイ、境界ボックス、マスクプレビューを出力
コミュニティリソース
- MediaPipe GitHub — MediaPipe アップストリームフレームワーク
- Comfy-Org/mediapipe — 公式 ComfyUI モデルウェイト
- ComfyUI Subgraph ガイド — サブグラフの仕組みを学ぶ