Fluxo de trabalho FLUX Kontext Face Swap para substituição de rosto limpa e fotorrealista
Este fluxo de trabalho ComfyUI realiza substituição de rosto de alta qualidade combinando uma etapa de alinhamento e colagem baseada em InsightFace com a geração de imagem-para-imagem FLUX.1 guiada por Kontext. É projetado para criadores que desejam trocas rápidas e confiáveis com mascaramento mínimo e mistura natural de pele e cabelo. O pipeline carrega um UNet Kontext preparado, aplica o Put it here LoRA, e regenera a região local para um resultado sem emendas.
O fluxo de trabalho FLUX Kontext Face Swap pega uma imagem base e uma imagem de rosto, detecta e alinha automaticamente o rosto, cola-o na base, escala o composto para FLUX e, em seguida, refina-o com amostragem guiada por prompt. Os resultados são pré-visualizados e salvos, com opções para ajustar cortes ou tornar a troca mais sutil ou mais forte.
Modelos principais no fluxo de trabalho Comfyui FLUX Kontext Face Swap
- FLUX.1-dev: O backbone de difusão que realiza o refinamento de imagem para imagem com condicionamento de contexto Kontext. Veja o cartão do modelo oficial para detalhes sobre arquitetura e comportamento. FLUX.1-dev
- FLUX autoencoder (AE): O VAE usado para codificar a imagem composta em latentes e decodificar saídas do amostrador de volta para pixels. Incluído com lançamentos do FLUX. FLUX.1-dev
- Text encoders CLIP-L and T5-XXL: Fornecem rico condicionamento de texto para o prompt que foca a região de troca e a expressão desejada. Artigos: CLIP, T5
- InsightFace: Detecção de rosto e análise de marcos para alinhamento e geração de cortes. InsightFace
- Put it here LoRA: Um LoRA específico para Kontext que localiza fortemente onde o FLUX deve reconstruir, ajudando o novo rosto a "sentar" precisamente na área pretendida.
Como usar o fluxo de trabalho Comfyui FLUX Kontext Face Swap
Este gráfico possui dois grupos principais que rodam em sequência: Transplante de rosto prepara um patch composto limpo; Ksampler e Saída regenera e polimenta com FLUX.
Transplante de rosto
Este grupo carrega sua Imagem Base (LoadImage (#108)) e Imagem de Rosto (LoadImage (#110)), depois encontra regiões de rosto com AutoCropFaces (#119, #122). Os cortes e marcos alimentam FaceAlign (#121), que deforma o rosto da fonte para corresponder à pose e escala da base. Image Paste Face (#125) mescla o rosto alinhado na base enquanto usa metadados de corte para uma sobreposição realista e apertada. FluxKontextImageScale (#134) então redimensiona o composto para as dimensões exatas que o Kontext espera, para que a codificação VAE a jusante seja sem perdas e estável.
O que fornecer:
- Uma foto base de alta qualidade com um rosto alvo claramente visível.
- Uma imagem de rosto com iluminação semelhante, quando possível.
- Se os cortes iniciais estiverem errados, ajuste a sensibilidade de auto-corte e o tamanho da caixa. A nota na tela lembra que resultados ruins geralmente melhoram relaxando ou apertando os valores de auto-corte.
Ksampler e Saída
DualCLIPLoader (#8) carrega os codificadores CLIP-L e T5-XXL, e CLIPTextEncode (#6) converte seu prompt em condicionamento. O prompt é escrito para focar na restauração da área do rosto e no controle da expressão; você pode editá-lo para ajustar detalhes como sorriso, cabelo ou maquiagem. ConditioningZeroOut (#4) controla a influência do texto para que o Kontext preserve o contexto fora da região de troca, e ReferenceLatent (#3) ancora a geração ao composto codificado. FluxGuidance (#5) equilibra o quanto o amostrador deve obedecer à referência versus seu prompt. O caminho do modelo executa UNETLoader (#140) com Kontext seguido por LoraLoaderModelOnly (#141), que aplica o Put it here LoRA. O composto é codificado por VAEEncode (#10), amostrado por KSampler (#9), decodificado por VAEDecode (#7), pré-visualizado e salvo com SaveImage (#19).
O que mudar:
- Edite o prompt em
CLIPTextEncodepara direcionar a expressão e o detalhe local. - Se a troca estiver muito forte ou fraca, ajuste a força do guia e os passos do amostrador.
- Mantenha o LoRA aplicado; ele é central para o posicionamento preciso no FLUX Kontext Face Swap.
Nós principais no fluxo de trabalho Comfyui FLUX Kontext Face Swap
AutoCropFaces (#119 e #122)
Detecta rostos e produz metadados de corte para alinhamento e colagem. Se o rosto for parcialmente perdido ou incluir cabelo que você não deseja, aumente ligeiramente o tamanho do corte ou diminua a confiança de detecção para captar mais contexto.
FaceAlign (#121)
Usa marcos do InsightFace para deformar o rosto da fonte na geometria do rosto base antes de mesclar. Troque o dispositivo de análise em FaceAnalysisModels (#120) para GPU quando disponível para um alinhamento mais rápido.
Image Paste Face (#125)
Mistura o rosto alinhado na imagem base usando os dados de corte. Se as bordas parecerem nítidas ou a cor estiver errada, tente uma caixa de corte ligeiramente maior ou reduza qualquer agressividade pós-prompt para que o FLUX faça menos pintura excessiva ao redor da borda.
FluxKontextImageScale (#134)
Redimensiona o composto para a forma nativa esperada pelo Kontext para que o VAE possa codificar sem distorção. Deixe isso no lugar para evitar estiramento ou desvio na saída refinada.
UNETLoader (#140)
Carrega o FLUX UNet ajustado para Kontext. Use isso junto com o LoRA para o comportamento pretendido do FLUX Kontext Face Swap. Alterar o checkpoint alterará notavelmente a textura da pele e a fidelidade geral.
LoraLoaderModelOnly (#141)
Aplica Put it here LoRA para localizar a reconstrução. Se a troca desviar ou as edições se espalharem fora do rosto, aumente ligeiramente a influência do LoRA. Se o visual parecer travado, reduza-o para mais liberdade criativa.
DualCLIPLoader (#8) e CLIPTextEncode (#6)
Fornecem condicionamento de texto. Mantenha os prompts curtos e direcionados à região do rosto e expressão. Evite pistas de estilo globais se você quiser preservar o fundo e a roupa da imagem base.
FluxGuidance (#5)
Equilibra o quanto o amostrador confia no composto de referência. Aumente para preservar mais firmemente a composição base, diminua para edições mais fortes guiadas por prompt dentro da área do rosto.
Extras opcionais
- Para linhas de cabelo teimosas ou obstruções, proponha explicitamente franja, costeletas ou "remover coque" para permitir que o Kontext reconstrua uma borda limpa.
- Combine a iluminação entre rosto e base quando possível. Se necessário, adicione uma dica de prompt breve sobre tom quente ou frio.
- Se os cortes falharem em rostos pequenos ou girados, comece com uma imagem base maior e de maior resolução para que a detecção tenha mais pixels para trabalhar.
- Mantenha as pré-visualizações ativadas enquanto você itera. Uma vez satisfeito, aumente ligeiramente a resolução ou os passos para o render final.
Agradecimentos
- Equipe FLUX por liberar modelos e documentação do FLUX.1. FLUX.1-dev
- Contribuidores do InsightFace por detecção e alinhamento de rostos robustos. InsightFace
- O criador do Put it here LoRA por orientação local precisa que permite posicionamento preciso no pipeline FLUX Kontext Face Swap.


