Z Image Workflow in ComfyUI | Geração em Alta Resolução em Tempo Real

Z Image Turbo para ComfyUI: texto rápido para imagem com iteração quase em tempo real

Este fluxo de trabalho traz o Z Image Turbo para o ComfyUI, permitindo que você gere visuais fotorrealistas de alta resolução com muito poucos passos e aderência rígida ao prompt. É projetado para criadores que precisam de renderizações rápidas e consistentes para arte conceitual, comps publicitários, mídia interativa e testes rápidos A/B.

O gráfico segue um caminho limpo de prompts de texto para uma imagem: carrega o modelo Z Image e componentes de suporte, codifica prompts positivos e negativos, cria uma tela latente, amostra com um cronograma AuraFlow e, em seguida, decodifica para RGB para salvar. O resultado é um pipeline Z Image simplificado que favorece a velocidade sem sacrificar detalhes.

Modelos principais no fluxo de trabalho Comfyui Z Image

Tongyi-MAI Z Image Turbo. O gerador principal que realiza a remoção de ruído de maneira destilada e eficiente em etapas. Ele visa o fotorrealismo, texturas nítidas e composição fiel enquanto mantém a latência baixa. Model card
Codificador de texto Qwen 4B (qwen_3_4b.safetensors). Fornece condicionamento de linguagem para que o estilo, o assunto e a composição em seu prompt orientem a trajetória de remoção de ruído.
Autoencoder AE (ae.safetensors). Traduz entre o espaço latente e os pixels para que o resultado final do Z Image possa ser visualizado e exportado.

Como usar o fluxo de trabalho Comfyui Z Image

Em um nível alto, o caminho vai do prompt para o condicionamento, através da amostragem do Z Image, então decodificando para uma imagem. Os nós são agrupados em estágios para manter a operação simples.

Carregadores de modelo: `UNETLoader` (#16), `CLIPLoader` (#18), `VAELoader` (#17)

Esta etapa carrega o ponto de verificação principal do Z Image Turbo, o codificador de texto e o autoencoder. Escolha o ponto de verificação BF16 se o tiver, pois ele equilibra velocidade e qualidade para GPUs de consumo. O codificador de estilo CLIP garante que sua redação controle a cena e o estilo. O AE é necessário para converter latentes de volta para RGB assim que a amostragem termina.

Prompting: `CLIP Text Encode (Positive Prompt)` (#6) e `CLIP Text Encode (Negative Prompt)` (#7)

Escreva o que deseja no prompt positivo usando substantivos concretos, dicas de estilo, sugestões de câmera e iluminação. Use o prompt negativo para suprimir artefatos comuns como desfoque ou objetos indesejados. Se você vir um prefácio de prompt, como um cabeçalho de instrução de um exemplo oficial, pode mantê-lo, editá-lo ou removê-lo, e o fluxo de trabalho ainda funcionará. Juntos, esses codificadores produzem o condicionamento que orienta o Z Image durante a amostragem.

Latente e agendador: `EmptySD3LatentImage` (#13) e `ModelSamplingAuraFlow` (#11)

Escolha o tamanho de sua saída definindo a tela latente. O nó do agendador troca o modelo para uma estratégia de amostragem no estilo AuraFlow que se alinha bem com modelos destilados eficientes em etapas. Isso mantém as trajetórias estáveis em contagens de etapas baixas enquanto preserva detalhes finos. Uma vez que a tela e o cronograma estejam definidos, o pipeline está pronto para remover ruído.

Amostragem: `KSampler` (#3)

Este nó realiza a remoção de ruído real usando o modelo Z Image carregado, o agendador selecionado e seu condicionamento de prompt. Ajuste o tipo de amostrador e a contagem de etapas para trocar velocidade por detalhes quando necessário. A escala de orientação controla a força do prompt em relação ao anterior; valores moderados geralmente oferecem o melhor equilíbrio entre fidelidade e variação criativa. Aleatorize a semente para exploração ou fixe-a para resultados repetíveis.

Decodificar e salvar: `VAEDecode` (#8) e `SaveImage` (#9)

Após a amostragem, o AE decodifica latentes para uma imagem. O nó de salvamento grava arquivos no seu diretório de saída para que você possa comparar iterações ou alimentar resultados em tarefas subsequentes. Se planeja aumentar a escala ou processar pós, mantenha a decodificação na resolução de trabalho desejada e exporte formatos sem perdas para melhor retenção de qualidade.

Nós principais no fluxo de trabalho Comfyui Z Image

`UNETLoader` (#16)

Carrega o ponto de verificação do Z Image Turbo (z_image_turbo_bf16.safetensors). Use isso para alternar entre variantes de precisão ou pesos atualizados à medida que se tornam disponíveis. Mantenha o modelo consistente em uma sessão se quiser que sementes e prompts permaneçam comparáveis. Alterar o modelo base mudará o visual, a resposta de cor e a densidade de detalhes.

`ModelSamplingAuraFlow` (#11)

Define a estratégia de amostragem para um cronograma no estilo AuraFlow adequado para rápida convergência. Esta é a chave para tornar o Z Image eficiente em contagens de etapas baixas enquanto preserva detalhes e coerência. Se trocar cronogramas mais tarde, verifique novamente as contagens de etapas e a orientação para manter características de saída semelhantes.

`KSampler` (#3)

Controla o algoritmo de amostragem, etapas, orientação e semente. Use menos etapas para ideação rápida e aumente apenas quando precisar de mais micro detalhes ou aderência mais rigorosa ao prompt. Diferentes amostradores favorecem diferentes aparências; experimente alguns e mantenha o restante do pipeline fixo ao comparar resultados.

`CLIP Text Encode (Positive Prompt)` (#6)

Codifica a intenção criativa que impulsiona o Z Image. Concentre-se no assunto, meio, lente, iluminação, composição e quaisquer restrições de marca ou design. Emparelhe com o nó de prompt negativo para direcionar a imagem em direção ao seu visual alvo enquanto filtra artefatos conhecidos.

Extras opcionais

Use resoluções quadradas ou quase quadradas para a primeira passagem, depois ajuste a proporção uma vez que a composição esteja bloqueada.
Mantenha uma biblioteca de fragmentos de prompt reutilizáveis para assuntos, lentes e iluminação para acelerar a iteração em projetos.
Para direção de arte consistente, fixe a semente e varie apenas um único fator por iteração, como uma tag de estilo ou dica de câmera.
Se as saídas parecerem muito controladas, reduza ligeiramente a orientação ou remova frases excessivamente prescritivas do prompt positivo.
Ao preparar ativos para edição subsequente, exporte PNGs sem perdas e mantenha um registro do prompt, semente e resolução junto com cada renderização de Z Image.

Agradecimentos

Este fluxo de trabalho implementa e constrói sobre os seguintes trabalhos e recursos. Agradecemos a Tongyi-MAI pelo Z-Image-Turbo por suas contribuições e manutenção. Para detalhes autoritativos, consulte a documentação e os repositórios originais vinculados abaixo.

Recursos

Tongyi-MAI/Z-Image-Turbo
- Hugging Face: Tongyi-MAI/Z-Image-Turbo

Nota: O uso dos modelos, conjuntos de dados e código referenciados está sujeito às respectivas licenças e termos fornecidos por seus autores e mantenedores.

Want More ComfyUI Workflows?

Wan 2.1 | Geração de Vídeo Revolucionária

Crie vídeos incríveis a partir de texto ou imagens com IA revolucionária rodando em CPUs comuns.

Wan 2.1 LoRA

Melhore a geração de vídeo Wan 2.1 com modelos LoRA para estilo e personalização aprimorados.

Wan 2.1 Control LoRA | Profundidade e Azulejo

Avance na geração de vídeo Wan 2.1 com LoRAs de profundidade e azulejo leves para melhorar a estrutura e o detalhe.

Wan 2.1 Fun | Geração de Vídeos ControlNet

Gere vídeos com passagens visuais estilo ControlNet como Profundidade, Canny e OpenPose.

Wan 2.1 Video Restyle | Transformação Consistente de Estilo de Vídeo

Transforme o estilo do seu vídeo aplicando o primeiro quadro reestilizado usando o fluxo de trabalho Wan 2.1 video restyle.

Hunyuan Imagem para Vídeo | Criador de Movimento Deslumbrante

Crie filmes magníficos a partir de imagens estáticas através de movimento cinematográfico e efeitos personalizáveis.

Mochi 1 | Genmo Texto para Vídeo

Demonstração de Texto para Vídeo Usando o Modelo Genmo Mochi 1

Wan 2.2 Geração de Imagens | Pacote de Fluxo de Trabalho 2-em-1

MoE Mix + Somente-Baixo com aumento de resolução. Escolha um.

Suporte

Recursos

Legal

RunComfy

RunComfy é a principal ComfyUI plataforma, oferecendo ComfyUI online ambiente e serviços, juntamente com fluxos de trabalho do ComfyUI apresentando visuais impressionantes. RunComfy também oferece AI Models, permitindo que artistas utilizem as mais recentes ferramentas de AI para criar arte incrível.

Z Image | Gerador Fotorrealista Ultra-Rápido

Z Image Turbo para ComfyUI: texto rápido para imagem com iteração quase em tempo real

Modelos principais no fluxo de trabalho Comfyui Z Image

Como usar o fluxo de trabalho Comfyui Z Image

Carregadores de modelo: UNETLoader (#16), CLIPLoader (#18), VAELoader (#17)

Prompting: CLIP Text Encode (Positive Prompt) (#6) e CLIP Text Encode (Negative Prompt) (#7)

Latente e agendador: EmptySD3LatentImage (#13) e ModelSamplingAuraFlow (#11)

Amostragem: KSampler (#3)

Decodificar e salvar: VAEDecode (#8) e SaveImage (#9)

Nós principais no fluxo de trabalho Comfyui Z Image

UNETLoader (#16)

ModelSamplingAuraFlow (#11)

KSampler (#3)

CLIP Text Encode (Positive Prompt) (#6)

Extras opcionais

Agradecimentos

Recursos

Want More ComfyUI Workflows?

Wan 2.1 | Geração de Vídeo Revolucionária

Wan 2.1 LoRA

Wan 2.1 Control LoRA | Profundidade e Azulejo

Wan 2.1 Fun | Geração de Vídeos ControlNet

Wan 2.1 Video Restyle | Transformação Consistente de Estilo de Vídeo

Hunyuan Imagem para Vídeo | Criador de Movimento Deslumbrante

Mochi 1 | Genmo Texto para Vídeo

Wan 2.2 Geração de Imagens | Pacote de Fluxo de Trabalho 2-em-1

Carregadores de modelo: `UNETLoader` (#16), `CLIPLoader` (#18), `VAELoader` (#17)

Prompting: `CLIP Text Encode (Positive Prompt)` (#6) e `CLIP Text Encode (Negative Prompt)` (#7)

Latente e agendador: `EmptySD3LatentImage` (#13) e `ModelSamplingAuraFlow` (#11)

Amostragem: `KSampler` (#3)

Decodificar e salvar: `VAEDecode` (#8) e `SaveImage` (#9)

`UNETLoader` (#16)

`ModelSamplingAuraFlow` (#11)

`KSampler` (#3)

`CLIP Text Encode (Positive Prompt)` (#6)