Modelos Ajustados Z-Image: geração de imagem multi‑estilo e de alta qualidade no ComfyUI
Este fluxo de trabalho reúne o Z-Image-Turbo e um conjunto rotativo de modelos ajustados Z-Image em um único gráfico ComfyUI pronto para produção. Ele é projetado para comparar estilos lado a lado, manter o comportamento do prompt consistente e produzir resultados nítidos e coerentes com passos mínimos. Nos bastidores, combina carregamento UNet otimizado, normalização CFG, amostragem compatível com AuraFlow e injeção LoRA opcional para que você possa explorar realismo, retratismo cinematográfico, fantasia sombria e visuais inspirados em anime sem reconfigurar sua tela.
Modelos Ajustados Z-Image são ideais para artistas, engenheiros de prompt e exploradores de modelos que querem uma maneira rápida de avaliar múltiplos pontos de verificação e LoRAs enquanto permanecem em um único pipeline consistente. Insira um prompt, renderize quatro variações de diferentes ajustes Z-Image e rapidamente determine o estilo que melhor se adapta ao seu briefing.
Modelos principais no fluxo de trabalho Comfyui Z-Image Finetuned Models
- Tongyi‑MAI Z‑Image‑Turbo. Um Transformer de Difusão de Fluxo Único com 6 bilhões de parâmetros destilado para texto-para-imagem fotorrealista em poucos passos com forte adesão a instruções e renderização de texto bilíngue. Pesos oficiais e notas de uso estão no cartão do modelo, com o relatório técnico e métodos de destilação detalhados no arXiv e no repositório do projeto. Model • Paper • Decoupled‑DMD • DMDR • GitHub • Diffusers pipeline
- BEYOND REALITY Z‑Image (ajuste da comunidade). Um ponto de verificação Z‑Image com tendência fotorrealista que enfatiza texturas brilhantes, bordas nítidas e acabamento estilizado, adequado para retratos e composições semelhantes a produtos. Model
- Z‑Image‑Turbo‑Realism LoRA (exemplo de LoRA usado na faixa LoRA deste fluxo de trabalho). Um adaptador leve que impulsiona a renderização ultra-realista enquanto preserva o alinhamento do prompt Z‑Image‑Turbo base; carregável sem substituir seu modelo base. Model
- Família AuraFlow (referência compatível com amostragem). O fluxo de trabalho utiliza ganchos de amostragem no estilo AuraFlow para gerações estáveis em poucos passos; consulte a referência do pipeline para informações sobre os agendadores AuraFlow e seus objetivos de design. Docs
Como usar o fluxo de trabalho Comfyui Z-Image Finetuned Models
O gráfico é organizado em quatro faixas de geração independentes que compartilham um codificador de texto comum e VAE. Use um prompt para conduzir todas as faixas e, em seguida, compare os resultados salvos de cada ramo.
- Modelo Geral
- A configuração compartilhada carrega o codificador de texto e VAE. Insira sua descrição no
CLIPTextEncodepositivo (#75) e adicione restrições opcionais aoCLIPTextEncodenegativo (#74). Isso mantém o condicionamento idêntico entre os ramos para que você possa julgar de forma justa como cada ajuste se comporta. OVAELoader(#21) fornece o decodificador usado por todas as faixas para transformar latentes de volta em imagens.
- A configuração compartilhada carrega o codificador de texto e VAE. Insira sua descrição no
- Z‑Image (Base Turbo)
- Esta faixa executa o UNet oficial Z‑Image‑Turbo via
UNETLoader(#100) e o corrige comModelSamplingAuraFlow(#76) para estabilidade em poucos passos.CFGNorm(#67) padroniza o comportamento da orientação livre de classificadores para que o contraste e o detalhe do sampler permaneçam previsíveis entre os prompts. UmEmptyLatentImage(#19) define o tamanho da tela, depoisKSampler(#78) gera latentes que são decodificados porVAEDecode(#79) e escritos porSaveImage(#102). Use este ramo como sua linha de base ao avaliar outros Modelos Ajustados Z-Image.
- Esta faixa executa o UNet oficial Z‑Image‑Turbo via
- Z‑Image‑Turbo + Realism LoRA
- Esta faixa injeta um adaptador de estilo com
LoraLoaderModelOnly(#106) sobre oUNETLoaderbase (#82).ModelSamplingAuraFlow(#84) eCFGNorm(#64) mantêm as saídas nítidas enquanto o LoRA impulsiona o realismo sem sobrecarregar o assunto. Defina a resolução comEmptyLatentImage(#71), gere comKSampler(#85), decodifique viaVAEDecode(#86) e salve usandoSaveImage(#103). Se um LoRA parecer muito forte, reduza seu peso aqui em vez de editar excessivamente seu prompt.
- Esta faixa injeta um adaptador de estilo com
- Ajuste BEYOND REALITY
- Este caminho substitui um ponto de verificação da comunidade com
UNETLoader(#88) para oferecer um visual estilizado e de alto contraste.CFGNorm(#66) doma a orientação para que a assinatura visual permaneça limpa quando você mudar amostradores ou passos. Defina o tamanho desejado emEmptyLatentImage(#72), renderize comKSampler(#89), decodifiqueVAEDecode(#90) e salve viaSaveImage(#104). Use o mesmo prompt que a faixa base para ver como este ajuste interpreta composição e iluminação.
- Este caminho substitui um ponto de verificação da comunidade com
- Ajuste Red Tide Dark Beast AIO
- Um ponto de verificação orientado para fantasia sombria é carregado com
CheckpointLoaderSimple(#92), depois normalizado porCFGNorm(#65). Esta faixa se inclina para paletas de cores sombrias e micro-contraste mais pesado enquanto mantém boa conformidade com o prompt. Escolha seu quadro emEmptyLatentImage(#73), gere comKSampler(#93), decodifique comVAEDecode(#94) e exporte deSaveImage(#105). É uma maneira prática de testar estéticas mais sombrias dentro da mesma configuração de Modelos Ajustados Z-Image.
- Um ponto de verificação orientado para fantasia sombria é carregado com
Nós principais no fluxo de trabalho Comfyui Z-Image Finetuned Models
ModelSamplingAuraFlow(#76, #84)- Propósito: corrige o modelo para usar um caminho de amostragem compatível com AuraFlow que é estável em contagens de passos muito baixas. O controle
shiftajusta subtilmente as trajetórias de amostragem; trate-o como um dial de finesse que interage com sua escolha de amostrador e orçamento de passos. Para melhor comparabilidade entre faixas, mantenha o mesmo amostrador e ajuste apenas uma variável (por exemplo,shiftou peso LoRA) por teste. Referência: histórico do pipeline AuraFlow e notas de agendamento. Docs
- Propósito: corrige o modelo para usar um caminho de amostragem compatível com AuraFlow que é estável em contagens de passos muito baixas. O controle
CFGNorm(#64, #65, #66, #67)- Propósito: normaliza a orientação livre de classificadores para que o contraste e o detalhe não oscilem descontroladamente quando você mudar modelos, passos ou agendadores. Aumente sua
strengthse os destaques se apagarem ou as texturas parecerem inconsistentes entre as faixas; reduza se as imagens começarem a parecer excessivamente comprimidas. Mantenha-o semelhante entre ramos quando você quiser um A/B limpo dos Modelos Ajustados Z-Image.
- Propósito: normaliza a orientação livre de classificadores para que o contraste e o detalhe não oscilem descontroladamente quando você mudar modelos, passos ou agendadores. Aumente sua
LoraLoaderModelOnly(#106)- Propósito: injeta um adaptador LoRA diretamente no UNet carregado sem alterar o ponto de verificação base. O parâmetro
strengthcontrola o impacto estilístico; valores mais baixos preservam o realismo base enquanto valores mais altos impõem a aparência do LoRA. Se um LoRA sobrecarregar rostos ou tipografia, reduza seu peso primeiro, depois ajuste finamente a formulação do prompt.
- Propósito: injeta um adaptador LoRA diretamente no UNet carregado sem alterar o ponto de verificação base. O parâmetro
KSampler(#78, #85, #89, #93)- Propósito: executa o loop de difusão real. Escolha um amostrador e agendador que se encaixem bem com destilações de poucos passos; muitos usuários preferem amostradores no estilo Euler com agendadores uniformes ou multistep para modelos da classe Turbo. Mantenha as sementes fixas ao comparar faixas e mude apenas uma variável de cada vez para entender como cada ajuste se comporta.
Extras opcionais
- Comece com um prompt descritivo em estilo de parágrafo e reutilize-o em todas as faixas para julgar as diferenças entre Modelos Ajustados Z-Image; itere palavras de estilo apenas após escolher um ramo favorito.
- Para modelos da classe Turbo, CFG muito baixo ou até mesmo zero frequentemente produz os resultados mais limpos; use o prompt negativo apenas quando precisar excluir elementos específicos.
- Mantenha a mesma resolução, amostrador e semente ao fazer testes A/B; altere o peso LoRA ou
shiftem pequenos incrementos para isolar causa e efeito. - Cada ramo escreve sua própria saída; os quatro nós
SaveImagesão rotulados exclusivamente para que você possa comparar e curar rapidamente.
Links para leitura adicional:
- Cartão do modelo Z‑Image‑Turbo: Tongyi-MAI/Z-Image-Turbo
- Relatório técnico e métodos: Z‑Image • Decoupled‑DMD • DMDR
- Repositório do projeto: Tongyi‑MAI/Z‑Image
- Exemplo de ajuste: Nurburgring/BEYOND_REALITY_Z_IMAGE
- Exemplo de LoRA: Z‑Image‑Turbo‑Realism‑LoRA
Agradecimentos
Este fluxo de trabalho implementa e se baseia nos seguintes trabalhos e recursos. Agradecemos imensamente aos modelos HuggingFace pelo artigo por suas contribuições e manutenção. Para detalhes autoritativos, consulte a documentação original e os repositórios vinculados abaixo.
Recursos
- Modelos HuggingFace:
Nota: O uso dos modelos, conjuntos de dados e códigos referenciados está sujeito às respectivas licenças e termos fornecidos por seus autores e mantenedores.




