この ComfyUI ワークフローは、InsightFace ベースのアライメントとペーストステージを FLUX.1 画像生成と組み合わせることで、高品質な顔の置換を実行します。これにより、迅速で信頼性のある置換を求めるクリエイターのために、最小限のマスキングと自然な肌および髪のブレンドを実現します。このパイプラインは準備された Kontext UNet をロードし、Put it here LoRA を適用し、シームレスな結果を得るために局所領域を再生成します。
FLUX Kontext Face Swap ワークフローは、ベース画像と顔画像を取り込み、顔を自動検出してアラインメントし、ベースにペーストし、FLUX に合わせて合成をスケーリングし、プロンプトガイド付きサンプリングで洗練します。結果はプレビューされ、保存され、クロップを締めたり、置換を微妙または強力にするオプションがあります。
このグラフには、順番に実行される 2 つの主要なグループがあります: 顔移植 はクリーンな合成パッチを準備します; Ksampler and Output はそれを FLUX で再生成し、磨きます。
このグループはあなたの Base Image (LoadImage
(#108)) と Face Image (LoadImage
(#110)) をロードし、AutoCropFaces
(#119, #122) で顔領域を見つけます。クロップとランドマークは FaceAlign
(#121) に供給され、ソースの顔をベースのポーズとスケールに合わせて変形します。Image Paste Face
(#125) は、クロップメタデータを使ってアラインされた顔をベースにマージし、タイトでリアルなオーバーレイを実現します。次に FluxKontextImageScale
(#134) が合成を Kontext が期待する正確な寸法にリスケールし、ダウンストリーム VAE エンコードがロスレスで安定するようにします。
提供するもの:
DualCLIPLoader
(#8) は CLIP-L と T5-XXL エンコーダーをロードし、CLIPTextEncode
(#6) はプロンプトをコンディショニングに変換します。プロンプトは顔の領域を復元し、表情を制御することに焦点を当てて書かれており、微笑み、髪、メイクなどの詳細を調整することができます。ConditioningZeroOut
(#4) はテキストの影響を制限し、Kontext が置換領域外のコンテキストを保持します。ReferenceLatent
(#3) は生成をエンコードされた合成にアンカーします。FluxGuidance
(#5) は、サンプラーがリファレンスをどれだけ従うべきかをバランスします。モデルパスは Kontext で UNETLoader
(#140) を実行し、その後 LoraLoaderModelOnly
(#141) を実行して Put it here LoRA を適用します。合成は VAEEncode
(#10) によりエンコードされ、KSampler
(#9) によりサンプリングされ、VAEDecode
(#7) によりデコードされ、プレビューされ、SaveImage
(#19) で保存されます。
変更するもの:
CLIPTextEncode
のプロンプトを編集し、表現と局所的な詳細を操作します。AutoCropFaces
(#119 と #122)顔を検出し、アライメントとペースト用のクロップメタデータを生成します。顔が部分的に見逃されたり、不要な髪が含まれている場合は、クロップサイズをわずかに増やすか、検出信頼度を下げてより多くのコンテキストを拾えるようにします。
FaceAlign
(#121)InsightFace ランドマークを使用して、ソースの顔をベースの顔のジオメトリに合わせて変形し、マージする前に使用します。FaceAnalysisModels
(#120) の分析デバイスを GPU
に切り替えると、アライメントが速くなります。
Image Paste Face
(#125)アラインされた顔をクロップデータを使用してベース画像にブレンドします。エッジがシャープに見えたり、色がオフになっている場合は、クロップボックスをわずかに大きくするか、ポストプロンプトの積極性を減らして FLUX が境界周辺でのオーバーペインティングを減らすようにします。
FluxKontextImageScale
(#134)合成を Kontext によって期待されるネイティブ形状にリスケールし、VAE が歪みなくエンコードできるようにします。これをそのままにしておくことで、精緻化された出力のストレッチやドリフトを防ぎます。
UNETLoader
(#140)Kontext チューニングされた FLUX UNet をロードします。これを LoRA と一緒に使用して FLUX Kontext Face Swap の意図された動作を実現します。チェックポイントを変更すると、肌の質感や全体的な忠実度が顕著に変わります。
LoraLoaderModelOnly
(#141)Put it here LoRA を適用してローカル再構築を行います。置換がドリフトしたり、編集が顔の外に広がったりする場合は、LoRA の影響をわずかに増やします。見た目が固定されたように感じる場合は、創造的な自由度を高めるためにそれを減らします。
DualCLIPLoader
(#8) と CLIPTextEncode
(#6)テキストコンディショニングを提供します。プロンプトは顔の領域と表情に焦点を合わせて短く保ちます。ベース画像の背景や衣服を保持したい場合は、グローバルなスタイルのキューを避けてください。
FluxGuidance
(#5)サンプラーがリファレンス合成をどれだけ信頼するかをバランスします。それを上げることでベースの構成をより厳密に保持し、顔領域内でプロンプト駆動の編集を強化します。
RunComfyは最高の ComfyUI プラットフォームです。次のものを提供しています: ComfyUIオンライン 環境とサービス、および ComfyUIワークフロー 魅力的なビジュアルが特徴です。 RunComfyはまた提供します AI Playground, アーティストが最新のAIツールを活用して素晴らしいアートを作成できるようにする。