Kling 2.6 Motion Control API ノード ComfyUI 公式サンプル

Kling 2.6 Motion Control は、快手（Kuaishou）社が開発した専用のマルチモーダルモデルであり、参照動画からキャラクター画像への高精度なモーション転送を実現します。参照画像（あなたのキャラクター）とモーション参照動画（動作の元となる動画）を組み合わせることで、AI は動画内の動作・表情・テンポを静止したキャラクターに適用しつつ、そのキャラクター固有のアイデンティティを維持します。標準的な「画像→動画」生成では、テキストプロンプトから動作を推測しますが、Motion Control はテキストではなく参照動画を「動作の設計図」として使用します。このモデルはデジタル・マリオネット職人（パペット師）のように機能し、参照動画から振付（チョアグラフィー）を抽出し、映画級の忠実度でキャラクターに適用します。

主な製品特長

複雑なモーション処理: ダンス・武術・スポーツなど高度な連続動作を、キャラクターの整合性を損なわず実行可能。重心移動や運動量（モーメンタム）を理解し、リアルな物理的インパクトを再現します。
高精度な手・指の表現: 手の描写は従来、AI 動画における弱点でした。本機能は実写素材を模倣することで、特に指の関節可動性や手の動きを向上させ、プレゼンテーションやデモンストレーションに最適です。
シーンおよび環境の柔軟性: テキストプロンプトを用いて背景環境を変更できますが、キャラクターは引き続き参照動画に基づくモーションを継続します。参照動画の背景に縛られることはありません。
高度なカメラおよび視点モード: 異なる「向きモード」を用いることで、参照動画に対するカメラの解釈を細かく制御できます。
30秒間の一括生成対応: 単一の生成処理で最大30秒間の連続動作を出力可能であり、物語的なシーンにおいてキャラクターの途切れのない動きを実現します。

キャラクターの向きモード

character_orientation パラメーターは、モデルが空間情報をどのように解釈するか、および出力の最大持続時間を制約します：

モード	説明	最大持続時間
`video`	出力されるキャラクターの向きは参照動画と一致します。ダンス・複雑な振付など、全身を使った高度なパフォーマンスに最適です。	30秒
`image`	出力されるキャラクターの向きは参照画像と一致します。パン・チルト・トラッキングショットなど、カメラ移動を伴う肖像画アニメーションに最適です。	10秒

モデルのレベル区分

レベル	解像度	主な用途
Standard（標準）	720p	シンプルなアニメーション、SNS向けコンテンツ、ミーム、素早いテストなど。処理速度が速く、クレジット効率も高いです。
Pro（プロ）	1080p	複雑な振付、精緻な手の動き、プロフェッショナルなマーケティング資材、放送品質のコンテンツなど。

APIノードを使用するには、正しくログインしていることと、許可されたネットワーク環境で使用していることを確認する必要があります。APIノードの使用に必要な具体的な要件については、ドキュメントの「APIノードの概要」セクションをご参照ください。

ポータブル版または自宅サーバーで実行しているユーザー
デスクトップ版またはクラウド版ユーザー

ComfyUI が最新版に更新されていることを確認してください。

このガイドで紹介するワークフローは、ワークフローテンプレートから入手できます。
テンプレート内に該当のワークフローが見つからない場合、ComfyUI のバージョンが古くなっている可能性があります。（デスクトップ版の更新は若干遅れることがあります）ワークフローを読み込んだ際にノードが欠落している場合の主な原因：

最新の ComfyUI（Nightly 版）を使用していない
起動時に一部のノードのインポートに失敗している

Kling 2.6 Motion Control のワークフロー

JSON形式のワークフローファイルをダウンロード

入力要件

画像形式: JPG、PNG、WEBP、GIF、AVIF（最大10MB）
動画形式: MP4、MOV、WEBM、M4V、GIF（最大100MB）
動画長: 向きモードに応じて3～30秒
最低解像度: 幅・高さともに720px以上
被写体の可視性: キャラクターの頭部、肩、上半身が明確に確認できること

より良い結果を得るためのヒント

アスペクト比の一致: キャラクター画像と参照動画のアスペクト比（例：どちらも16:9、またはどちらも9:16）を揃えることで、不自然な伸びや切り取りを防ぎます。
シンプルな背景: 動作抽出の精度を高めるため、背景が単純または静止している参照動画を使用してください。特に、演者のシルエットがはっきりと分かる高コントラスト動画が最も効果的です。
明確なキャラクター角度: 参照動画に回転動作が含まれる場合、3Dスタイルのキャラクターやリアルな写真の方が回転をより自然に再現できます。平面的な2Dイラストでは背面の描写に課題があることがあります。
四肢の可視性: 入力画像においてキャラクターの四肢が明確に見えるようにしてください。たとえば、キャラクターの手がポケットの中にありながら、モーションで手を振る動作が必要な場合、AI は手を「幻覚生成（ハリューシネーション）」してしまうため、アーティファクトが発生しやすくなります。
余白（ネガティブスペース）の確保: 被写体の周囲に十分な余白を設けてください。キャラクターがダンスや腕の振りなどの広範囲の動きをする場合、フレーム内に十分な空間がないと、動きが画面外へ切り取られ（クリッピング）てしまいます。
構図の整合性: 画像と参照動画の構図を揃えてください。顔のアニメーションにはクローズアップの参照動画を、歩行やダンスなどの全身動作にはフルボディの参照動画を用いましょう。

Documentation Index

​主な製品特長

​キャラクターの向きモード

​モデルのレベル区分

​Kling 2.6 Motion Control のワークフロー

​入力要件

​より良い結果を得るためのヒント

主な製品特長

キャラクターの向きモード

モデルのレベル区分

Kling 2.6 Motion Control のワークフロー

入力要件

より良い結果を得るためのヒント