Z Image Turbo Headswap for Characters: キャラクターポートレート用の高速かつ正確なヘッド交換
Z Image Turbo Headswap for Charactersは、キャラクターの頭部を交換しながら、元の照明、ポーズ、スタイルを保持することに特化したComfyUIワークフローです。Z-Image Turboをガイドし、頭部領域のみを編集することで、ハロやプラスチックのような質感を避けたシームレスでフォトリアルな結果を生み出します。
クリエイター、キャラクターアーティスト、ポートレート編集者のために設計されたこのZ Image Turbo Headswap for Charactersワークフローは、スマートプロンプトのための自動キャプショニング、強力な顔と髪のマスクを提供するSAMスタイルのセグメンテーション、背景を触れずに保持するインペイントクロップアンドスティッチパスを使用します。オプションのキャラクターLoRAは、アイデンティティとスタイリングを精密にコントロールすることができます。
Comfyui Z Image Turbo Headswap for Charactersワークフローの主要モデル
- Z-Image Turbo (bf16)。実際のインペイントと再構築を行うディフュージョンバックボーンで、速度とフォトリアルな忠実性が評価されています。 モデルカード
- Z-Image Turbo VAE。Z-Image Turbo内外のラテントをエンコードおよびデコードするために使用されるペアのVAE。Z-Image Turboリリースに含まれています。
- Qwen3‑4B Z‑Image Engineer V4 (GGUF)。プロンプト条件付けのための高品質なテキストエンコーダーで、髪、表情、アクセサリーなどの属性のセマンティックステアリングを改善します。 モデルカード
- Z‑Image AbliteratedV1 (GGUF)。プロンプトの「感触」がわずかに異なる代替テキストエンコーダーで、説明的プロンプトに向けてより強いプッシュをしたいときに便利です。 モデルカード
- SAMスタイルのセグメンテーションチェックポイント (sam3.pt)。ComfyUI-SAM3拡張機能を介して顔と髪をターゲットにした編集のための強力でプロンプト可能なセグメンテーションを提供します。 リポジトリ
- オプションのキャラクターLoRAアダプター。Z-Image Turbo内でアイデンティティやスタイルを強化するための軽量アダプターで、編集全体で一貫したキャラクターの外観が必要な場合に使用します。
Comfyui Z Image Turbo Headswap for Charactersワークフローの使い方
ワークフローは強力なマスクで頭部を分離し、高解像度のインペイントのためにクロップし、その領域内でのみディフュージョンし、結果を元に戻して統合します。独立して動作するテストLoRAグループは、迅速なLoRA/プロンプト試行を可能にします。
ソースとプロンプトの準備
Source Image(#958)にベース画像をロードします。これは、頭部を交換したいポートレートです。Auto Prompt(#1018)は画像を分析し、説明的なプロンプトを生成します。保持または変更したい髪の色、頭の角度、アクセサリーなどの重要なメモをText Multiline(#1071)に追加します。- ワークフローは、これらを
Text Concatenate(#1070)で1つのプロンプトにマージし、選択したGGUFテキストエンコーダーを介してCLIPLoaderGGUF(#164)およびCLIPTextEncode(#944)でエンコードします。 - キュレーションされた
CLIP Text Encode (Negative Prompt)(#1082)は、望ましくない特性を相殺し、Z Image Turbo Headswap for Charactersをクリーンでリアルな出力に誘導します。
正確なヘッドマスクの作成
- サイズ変更された画像は2つのSAMスタイルセグメンターに渡されます:
Face Mask(#939)とHair Mask(#1078)。グラウンドテキストヒントを使用して、顔の特徴と髪を高いリコールで分離します。 Masks Combine Regions(#1079)は、これらの領域を融合させ、顔と髪の生え際を横断して交換を行い、目に見える縫い目を減少させます。- 専用のプレビュー(
Preview Mask for Face(#954)、Preview Mask for Hair(#1080)、および結合マスクビュー)は、ディフュージョンが行われる前にターゲット領域を確認するのに役立ちます。 - このデュアルマスクアプローチは、Z Image Turbo Headswap for Charactersにおいて中心的な役割を果たし、肌、髪、エッジのディテールを一貫して保持します。
インペイント用のクロップとモデルの条件付け
InpaintCropImproved(#1024)はマスクされた領域をクロップし、ディフュージョンパスが毛穴、髪の束、エッジをモデル化するのに十分なピクセルを持つように最小作業解像度を確保します。InpaintModelConditioning(#943)は、クロップされた画像とマスクに結びついた正と負の条件付けを準備し、選択したVAEに一致するラテント入力を提供します。- この段階で、ワークフローは編集を完全に頭部領域に制約し、プロンプトとオプションのLoRAが新しいアイデンティティや属性を定義することを可能にします。
ヘッドスワップディフュージョンパス
- LoRAで強化されたZ-Image Turboモデルは
DifferentialDiffusion(#949)を通じて流れ、編集がマスク内に集中し、マスクされていないコンテキストを保持します。 Head Swap Sampler(#1022)はインペイントを行います。より強い変化のためにはノイズ除去を増やし、ポーズと照明を保持するためにはそれを適度に保ちます。高いCFGはプロンプトとソースに対する適合性を強化しますが、過度にシャープになる可能性があります。低いCFGはより自然にブレンドします。- これはZ Image Turbo Headswap for Charactersであるため、モデルはプロンプトの言葉とLoRAの選択を尊重し、シーンを乱すことなくアイデンティティ、ヘアスタイル、表情の調整を可能にします。
ステッチと保存
- インペイントされたパッチは
VAEDecode(#947)でデコードされ、InpaintStitchImproved(#950)を使用してシームレスに元の解像度と背景の整合性を保持して統合されます。 SaveImage(#1084)は最終画像を書き込みます。Image Comparer (rgthree)(#1092)を使用して、クイックQAと反復のためにビフォーアフターをスライドさせます。- この最終段階でZ Image Turbo Headswap for Charactersパイプラインが完了し、目に見えるスワップアーティファクトのない統合されたポートレートが得られます。
テストLoRA(独立)
- テストLoRAグループは、ソースに触れずにLoRAの影響をプレビューすることができます。
Character Lora(#1083および#1057)にアダプターをロードし、CLIPTextEncode(#1088)で短いポジティブプロンプトを提供し、CLIPTextEncode(#1087)で一致するネガティブを提供します。 - 補助
Head Swap Sampler(#1091)は迅速にポートレートをVAEDecode(#1089)に生成し、メインスワップを実行する前にアイデンティティロックとスタイリングを判断できます。 - 見た目が気に入ったら、メインフローで同じLoRAの重みと言葉を再利用して、予測可能なZ Image Turbo Headswap for Charactersの結果を得られます。
Comfyui Z Image Turbo Headswap for Charactersワークフローの主要ノード
Face Mask (#939)
SAMスタイルのグラウンドを使用してモデルが正確にフィーチャーを交換する場所を認識できるようにする精密な顔領域を生成します。テキストヒントを調整することで、頬、顎、耳のブレンドを直接改善する正しい顔領域の検出を強化します。
Hair Mask (#1078)
髪の領域をターゲットにして、通常スワップを裏切る前髪、飛び出し、髪の生え際をキャプチャします。顔マスクに髪を含めることで、縫い目の可視性が大幅に減少し、額やこめかみ周辺の不一致なシェーディングを防ぎます。
Masks Combine Regions (#1079)
顔と髪のマスクを1つの編集領域に融合させます。この結合マスクは、インペイント中に肌と髪が交わる場所で一貫したテクスチャと照明を確保し、「切り抜き」外観を避けます。
InpaintCropImproved (#1024)
結合マスクの周囲をクロップし、作業領域をアップスケールして、サンプラーが十分なピクセル密度を持つようにします。必要に応じて文脈拡張を使用して、頭部領域と相互作用する帽子、前髪、アクセサリーを含めます。
InpaintModelConditioning (#943)
クロップされたパッチとマスクに結びついた正/負の条件付けを構築します。これにより、サンプラーがあなたの説明的プロンプトとローカル画像コンテキストの両方を読み取り、アイデンティティの変化をシーンの照明とカメラアングルに一致させます。
DifferentialDiffusion (#949)
マスクされた領域内での変更に集中し、マスクされていないコンテンツを保護します。特に背景が詳細である場合や、頭部外の小さな照明シフトが目立つ場合に役立ちます。
Head Swap Sampler (#1022)
インペイントディフュージョンを実行します。最も重要な2つのコントロールは、ノイズ除去強度とCFGガイダンスです。高いノイズ除去は変換を増加させますが、元のポーズから逸脱する可能性があります。高いCFGはプロンプトとLoRAを強制しますが、厳しい、よりスタイリッシュな仕上げになるリスクがあります。自然なスワップのために両方を一緒に調整します。
InpaintStitchImproved (#950)
クロップ段階からのステッチャーを使用して、編集されたクロップを完全解像度で再統合します。これにより、境界を越えてグローバルなシャープネスと色の連続性が維持され、シームレスな最終ポートレートが得られます。
オプションの追加
- 可能であればフロントまたは3/4アングルを優先し、ターゲットの説明またはLoRAをソースアングルに一致させて、最もクリーンなZ Image Turbo Headswap for Charactersの結果を得ます。
- 前髪や帽子のブレンドがうまくいかない場合は、インペイントパスの前に結合マスクをわずかに拡張します。
- 初回の実行ではノイズ除去を適度に保ち、新しいアイデンティティに到達するために必要に応じて少しずつ増やします。
- Auto Promptのベースラインを使用し、長いリストではなく、髪の色、表情、アクセサリーなどの決定的なトークンをいくつか追加します。
- ComfyUI-SAM3およびCrop-and-Stitch拡張機能は強力です。これらの最新リリースへの更新により、複雑なシーンでのマスク品質とステッチが改善される可能性があります。 ComfyUI-SAM3 • ComfyUI-Inpaint-CropAndStitch
謝辞
このワークフローは、次の作品およびリソースを実装および基にしています。@RetroGazzaSpursおよびr/StableDiffusionのZ Image Turbo Headswap for Characters Workflow Sourceの貢献と維持に感謝します。詳細については、以下にリンクされた元のドキュメントおよびリポジトリを参照してください。
リソース
- r/StableDiffusion/Z Image Turbo Headswap for Characters Workflow Source
- ドキュメント/リリースノート: Z Image Turbo Headswap for Characters Workflow Source
注:参照されたモデル、データセット、コードの使用は、それぞれの著者およびメンテナーによって提供されたライセンスおよび条件に従います。



