Este fluxo de trabalho traz o Z Image Turbo para o ComfyUI, permitindo que você gere visuais fotorrealistas de alta resolução com muito poucos passos e aderência rígida ao prompt. É projetado para criadores que precisam de renderizações rápidas e consistentes para arte conceitual, comps publicitários, mídia interativa e testes rápidos A/B.
O gráfico segue um caminho limpo de prompts de texto para uma imagem: carrega o modelo Z Image e componentes de suporte, codifica prompts positivos e negativos, cria uma tela latente, amostra com um cronograma AuraFlow e, em seguida, decodifica para RGB para salvar. O resultado é um pipeline Z Image simplificado que favorece a velocidade sem sacrificar detalhes.
Em um nível alto, o caminho vai do prompt para o condicionamento, através da amostragem do Z Image, então decodificando para uma imagem. Os nós são agrupados em estágios para manter a operação simples.
UNETLoader (#16), CLIPLoader (#18), VAELoader (#17)Esta etapa carrega o ponto de verificação principal do Z Image Turbo, o codificador de texto e o autoencoder. Escolha o ponto de verificação BF16 se o tiver, pois ele equilibra velocidade e qualidade para GPUs de consumo. O codificador de estilo CLIP garante que sua redação controle a cena e o estilo. O AE é necessário para converter latentes de volta para RGB assim que a amostragem termina.
CLIP Text Encode (Positive Prompt) (#6) e CLIP Text Encode (Negative Prompt) (#7)Escreva o que deseja no prompt positivo usando substantivos concretos, dicas de estilo, sugestões de câmera e iluminação. Use o prompt negativo para suprimir artefatos comuns como desfoque ou objetos indesejados. Se você vir um prefácio de prompt, como um cabeçalho de instrução de um exemplo oficial, pode mantê-lo, editá-lo ou removê-lo, e o fluxo de trabalho ainda funcionará. Juntos, esses codificadores produzem o condicionamento que orienta o Z Image durante a amostragem.
EmptySD3LatentImage (#13) e ModelSamplingAuraFlow (#11)Escolha o tamanho de sua saída definindo a tela latente. O nó do agendador troca o modelo para uma estratégia de amostragem no estilo AuraFlow que se alinha bem com modelos destilados eficientes em etapas. Isso mantém as trajetórias estáveis em contagens de etapas baixas enquanto preserva detalhes finos. Uma vez que a tela e o cronograma estejam definidos, o pipeline está pronto para remover ruído.
KSampler (#3)Este nó realiza a remoção de ruído real usando o modelo Z Image carregado, o agendador selecionado e seu condicionamento de prompt. Ajuste o tipo de amostrador e a contagem de etapas para trocar velocidade por detalhes quando necessário. A escala de orientação controla a força do prompt em relação ao anterior; valores moderados geralmente oferecem o melhor equilíbrio entre fidelidade e variação criativa. Aleatorize a semente para exploração ou fixe-a para resultados repetíveis.
VAEDecode (#8) e SaveImage (#9)Após a amostragem, o AE decodifica latentes para uma imagem. O nó de salvamento grava arquivos no seu diretório de saída para que você possa comparar iterações ou alimentar resultados em tarefas subsequentes. Se planeja aumentar a escala ou processar pós, mantenha a decodificação na resolução de trabalho desejada e exporte formatos sem perdas para melhor retenção de qualidade.
UNETLoader (#16)Carrega o ponto de verificação do Z Image Turbo (z_image_turbo_bf16.safetensors). Use isso para alternar entre variantes de precisão ou pesos atualizados à medida que se tornam disponíveis. Mantenha o modelo consistente em uma sessão se quiser que sementes e prompts permaneçam comparáveis. Alterar o modelo base mudará o visual, a resposta de cor e a densidade de detalhes.
ModelSamplingAuraFlow (#11)Define a estratégia de amostragem para um cronograma no estilo AuraFlow adequado para rápida convergência. Esta é a chave para tornar o Z Image eficiente em contagens de etapas baixas enquanto preserva detalhes e coerência. Se trocar cronogramas mais tarde, verifique novamente as contagens de etapas e a orientação para manter características de saída semelhantes.
KSampler (#3)Controla o algoritmo de amostragem, etapas, orientação e semente. Use menos etapas para ideação rápida e aumente apenas quando precisar de mais micro detalhes ou aderência mais rigorosa ao prompt. Diferentes amostradores favorecem diferentes aparências; experimente alguns e mantenha o restante do pipeline fixo ao comparar resultados.
CLIP Text Encode (Positive Prompt) (#6)Codifica a intenção criativa que impulsiona o Z Image. Concentre-se no assunto, meio, lente, iluminação, composição e quaisquer restrições de marca ou design. Emparelhe com o nó de prompt negativo para direcionar a imagem em direção ao seu visual alvo enquanto filtra artefatos conhecidos.
Este fluxo de trabalho implementa e constrói sobre os seguintes trabalhos e recursos. Agradecemos a Tongyi-MAI pelo Z-Image-Turbo por suas contribuições e manutenção. Para detalhes autoritativos, consulte a documentação e os repositórios originais vinculados abaixo.
Nota: O uso dos modelos, conjuntos de dados e código referenciados está sujeito às respectivas licenças e termos fornecidos por seus autores e mantenedores.
RunComfy é a principal ComfyUI plataforma, oferecendo ComfyUI online ambiente e serviços, juntamente com fluxos de trabalho do ComfyUI apresentando visuais impressionantes. RunComfy também oferece AI Playground, permitindo que artistas utilizem as mais recentes ferramentas de AI para criar arte incrível.