logo
RunComfy
ComfyUIPlaygroundPricing
discord logo
ComfyUI>Fluxos de Trabalho>Z Image ControlNet | Gerador de Imagens de Precisão

Z Image ControlNet | Gerador de Imagens de Precisão

Workflow Name: RunComfy/Z-Image-ControlNet
Workflow ID: 0000...1319
Este fluxo de trabalho ajuda você a criar imagens precisamente controladas com orientação baseada em referência usando o Z Image ControlNet. Você pode gerar composições usando bordas, profundidade ou poses humanas para definir estrutura e layout. É ideal para artistas conceituais, designers e fotógrafos que precisam de precisão de forma e consistência espacial. O processo combina prompts textuais e visuais para produzir resultados ricos e fotorrealistas. Desfrute de inferência rápida, opções de controle versáteis e resultados estáveis e repetíveis em cada renderização.

Fluxo de trabalho do Z Image ControlNet para geração de imagens guiadas por estrutura no ComfyUI

Este fluxo de trabalho traz o Z Image ControlNet para o ComfyUI para que você possa direcionar o Z‑Image Turbo com estrutura precisa a partir de imagens de referência. Ele combina três modos de orientação em um gráfico: profundidade, bordas canny e pose humana, e permite que você alterne entre eles para corresponder à sua tarefa. O resultado é uma geração rápida e de alta qualidade de texto ou imagem-para-imagem, onde layout, pose e composição permanecem sob controle enquanto você itera.

Projetado para artistas, designers conceituais e planejadores de layout, o gráfico suporta prompts bilíngues e estilização opcional de LoRA. Você obtém uma prévia limpa do sinal de controle escolhido, além de uma faixa de comparação automática para avaliar profundidade, canny ou pose em relação ao resultado final.

Modelos principais no fluxo de trabalho do Comfyui Z Image ControlNet

  • Modelo de difusão Z‑Image Turbo 6B parâmetros. Gerador principal que produz imagens fotorrealistas rapidamente a partir de prompts e sinais de controle. alibaba-pai/Z-Image-Turbo
  • Patch de união Z Image ControlNet. Adiciona controle de múltiplas condições ao Z‑Image Turbo e permite orientação de profundidade, bordas e pose em um patch de modelo. alibaba-pai/Z-Image-Turbo-Fun-Controlnet-Union
  • Depth Anything v2. Produz mapas de profundidade densos usados para orientação de estrutura no modo de profundidade. LiheYoung/Depth-Anything-V2 on GitHub
  • DWPose. Estima pontos-chave humanos e pose corporal para geração guiada por pose. IDEA-Research/DWPose
  • Detector de bordas Canny. Extrai arte de linha limpa e limites para controle orientado por layout.
  • Pré-processadores ControlNet Aux para ComfyUI. Fornece wrappers unificados para profundidade, bordas e pose usados por este gráfico. comfyui_controlnet_aux

Como usar o fluxo de trabalho do Comfyui Z Image ControlNet

Em um nível alto, você carrega ou faz upload de uma imagem de referência, seleciona um modo de controle entre profundidade, canny ou pose, e então gera com um prompt de texto. O gráfico dimensiona a referência para amostragem eficiente, constrói um latente na proporção de aspecto correspondente e salva tanto a imagem final quanto uma faixa de comparação lado a lado.

entradas

Use LoadImage (#14) para escolher uma imagem de referência. Insira seu prompt textual em Text Multiline (#17) a pilha Z‑Image suporta prompts bilíngues. O prompt é codificado por CLIPLoader (#2) e CLIPTextEncode (#4). Se preferir apenas imagem-para-imagem orientada por estrutura, você pode deixar o prompt mínimo e confiar no sinal de controle selecionado.

Seleção de três vias ControlNet

Três pré-processadores convertem sua referência em sinais de controle. AIO_Preprocessor (#45) produz profundidade com Depth Anything v2, AIO_Preprocessor (#46) extrai bordas canny, e DWPreprocessor (#56) estima pose de corpo inteiro. Use ImpactSwitch (#58) para selecionar qual sinal dirige o Z Image ControlNet, e verifique PreviewImage (#43) para confirmar o mapa de controle escolhido. Escolha profundidade quando quiser geometria de cena, canny para layout nítido ou fotos de produtos, e pose para trabalho de personagem.

Dicas para OpenPose:

  1. Melhor para Corpo Inteiro: OpenPose funciona melhor (~70-90% de precisão) quando você inclui "corpo inteiro" no seu prompt.
  2. Evite para Close-ups: A precisão cai significativamente em rostos. Use Depth ou Canny (força baixa/média) para close-ups.
  3. Prompting Importa: Prompts influenciam fortemente o ControlNet. Evite prompts vazios para evitar resultados confusos.

Ampliação

ImageScaleToTotalPixels (#34) redimensiona a referência para uma resolução de trabalho prática para equilibrar qualidade e velocidade. GetImageSizeAndCount (#35) lê o tamanho escalado e passa largura e altura para frente. EmptyLatentImage (#6) cria uma tela latente que corresponde ao aspecto do seu input redimensionado, para que a composição permaneça consistente.

saídas

QwenImageDiffsynthControlnet (#39) funde o modelo base com o patch de união Z Image ControlNet e a imagem de controle selecionada, então KSampler (#7) gera o resultado guiado por seu condicionamento positivo e negativo. VAEDecode (#8) converte o latente em uma imagem. O fluxo de trabalho salva duas saídas SaveImage (#31) grava a imagem final, e SaveImage (#42) grava uma faixa de comparação via ImageConcatMulti (#38) que inclui a fonte, o mapa de controle e o resultado para QA rápido.

Nós principais no fluxo de trabalho do Comfyui Z Image ControlNet

ImpactSwitch (#58)

Escolhe qual imagem de controle dirige a geração: profundidade, canny ou pose. Altere modos para comparar como cada restrição molda composição e detalhe. Use-o ao iterar layouts para testar rapidamente qual orientação melhor se adapta ao seu objetivo.

QwenImageDiffsynthControlnet (#39)

Conecta o modelo base, o patch de união Z Image ControlNet, o VAE e o sinal de controle selecionado. O parâmetro strength determina quão estritamente o modelo segue o input de controle versus o prompt. Para correspondência de layout rigorosa, aumente a força para mais variação criativa, reduza-a.

AIO_Preprocessor (#45)

Executa o pipeline Depth Anything v2 para criar mapas de profundidade densos. Aumente a resolução para estrutura mais detalhada ou reduza para pré-visualizações mais rápidas. Combina bem com cenas arquitetônicas, fotos de produtos e paisagens onde a geometria importa.

DWPreprocessor (#56)

Gera mapas de pose adequados para pessoas e personagens. Funciona melhor quando os membros estão visíveis e não estão fortemente ocultos. Se mãos ou pernas estiverem faltando, tente uma referência mais clara ou um quadro diferente com mais visibilidade do corpo completo.

LoraLoaderModelOnly (#54)

Aplica um LoRA opcional ao modelo base para dicas de estilo ou identidade. Ajuste strength_model para misturar o LoRA suavemente ou fortemente. Você pode trocar um LoRA de rosto para personalizar sujeitos ou usar um LoRA de estilo para fixar um visual específico.

KSampler (#7)

Realiza amostragem de difusão usando seu prompt e controle. Ajuste seed para reprodutibilidade, steps para orçamento de refinamento, cfg para adesão ao prompt, e denoise para quanto o resultado pode se desviar do latente inicial. Para edições de imagem-para-imagem, reduza denoise para preservar a estrutura; valores mais altos permitem mudanças maiores.

Extras opcionais

  • Para apertar a composição, use o modo de profundidade com uma referência limpa e bem iluminada; canny favorece forte contraste, e pose favorece fotos de corpo inteiro.
  • Para edições sutis a partir de uma imagem de origem, mantenha o denoise modesto e aumente a força do ControlNet para estrutura fiel.
  • Aumente os pixels alvo no grupo de Ampliação quando precisar de mais detalhes, depois reduza novamente para rascunhos rápidos.
  • Use a saída de comparação para testar rapidamente A/B entre profundidade vs canny vs pose e escolher o controle mais confiável para seu assunto.
  • Substitua o LoRA de exemplo por seu próprio LoRA de rosto ou estilo para incorporar identidade ou direção de arte sem retreinamento.

Agradecimentos

Este fluxo de trabalho implementa e se baseia nos seguintes trabalhos e recursos. Agradecemos a Alibaba PAI pelo Z Image ControlNet por suas contribuições e manutenção. Para detalhes autoritários, consulte a documentação e repositórios originais vinculados abaixo.

Recursos

  • Alibaba PAI/Z Image ControlNet
    • Hugging Face: alibaba-pai/Z-Image-Turbo-Fun-Controlnet-Union

Nota: O uso dos modelos, conjuntos de dados e código referenciados está sujeito às respectivas licenças e termos fornecidos por seus autores e mantenedores.

Want More ComfyUI Workflows?

Flux Consistent Characters | Input Image

Flux Consistent Characters | Input Image

Crie personagens consistentes e garanta que eles pareçam uniformes usando suas imagens.

FLUX ControlNet Depth-V3 & Canny-V3

Obtenha melhor controle com FLUX-ControlNet-Depth & FLUX-ControlNet-Canny para FLUX.1 [dev].

FLUX LoRA (RealismLoRA) | Imagens Fotorealistas

FLUX LoRA (RealismLoRA) | Imagens Fotorealistas

Misture o modelo FLUX-1 com FLUX-RealismLoRA para imagens de IA fotorealistas

FLUX Controlnet Inpainting

Melhore o realismo usando ControlNet para guiar o FLUX.1-dev.

Criador de Personagem Consistente

Crie designs de personagens consistentes e de alta resolução a partir de múltiplos ângulos com controle total sobre emoções, iluminação e ambientes.

SVD (Stable Video Diffusion) + SD | Texto para Vídeo

Integre o Stable Diffusion e o Stable Video Diffusion para converter texto diretamente em vídeo.

Multitalk | Criador de Vídeo Falante Realista

Crie vídeos de sincronização labial com vários falantes a partir de retratos e vozes com um clique!

SUPIR + Foolhardy Remacri | Aumento de escala de imagem/vídeo 8K

SUPIR + Foolhardy Remacri | Aumento de escala de imagem/vídeo 8K

Aumente a escala de imagens para 8K com o modelo SUPIR e 4x Foolhardy Remacri.

Siga-nos
  • LinkedIn
  • Facebook
  • Instagram
  • Twitter
Suporte
  • Discord
  • E-mail
  • Status do Sistema
  • afiliado
Recursos
  • ComfyUI Online Gratuito
  • Guias do ComfyUI
  • RunComfy API
  • Tutoriais do ComfyUI
  • Nós do ComfyUI
  • Saiba Mais
Legal
  • Termos de Serviço
  • Política de Privacidade
  • Política de Cookies
RunComfy
Copyright 2025 RunComfy. Todos os Direitos Reservados.

RunComfy é a principal ComfyUI plataforma, oferecendo ComfyUI online ambiente e serviços, juntamente com fluxos de trabalho do ComfyUI apresentando visuais impressionantes. RunComfy também oferece AI Playground, permitindo que artistas utilizem as mais recentes ferramentas de AI para criar arte incrível.