Modelos Ajustados Z-Image: generación de imágenes de alta calidad y multiestilo en ComfyUI
Este flujo de trabajo ensambla Z-Image-Turbo y un conjunto rotativo de modelos ajustados Z-Image en un único gráfico de ComfyUI listo para producción. Está diseñado para comparar estilos lado a lado, mantener el comportamiento del prompt consistente y producir resultados nítidos y coherentes con pasos mínimos. Bajo el capó combina carga optimizada de UNet, normalización CFG, muestreo compatible con AuraFlow, e inyección opcional de LoRA para que puedas explorar realismo, retratos cinematográficos, fantasía oscura y looks inspirados en anime sin reconfigurar tu lienzo.
Los Modelos Ajustados Z-Image son ideales para artistas, ingenieros de prompts y exploradores de modelos que desean una forma rápida de evaluar múltiples puntos de control y LoRAs mientras se mantienen dentro de un único pipeline consistente. Introduce un prompt, renderiza cuatro variaciones de diferentes afinaciones Z-Image, y bloquea rápidamente el estilo que mejor se ajuste a tu brief.
Modelos clave en el flujo de trabajo Comfyui de Modelos Ajustados Z-Image
- Tongyi-MAI Z-Image-Turbo. Un Transformador de Difusión de Flujo Único de 6B parámetros destilado para texto-a-imagen fotorrealista de pocos pasos con fuerte adherencia a instrucciones y renderizado de texto bilingüe. Los pesos oficiales y notas de uso están en la tarjeta del modelo, con el informe técnico y métodos de destilación detallados en arXiv y en el repositorio del proyecto. Model • Paper • Decoupled-DMD • DMDR • GitHub • Diffusers pipeline
- BEYOND REALITY Z-Image (afinación comunitaria). Un punto de control Z-Image orientado al fotorrealismo que enfatiza texturas brillantes, bordes nítidos y acabados estilizados, adecuado para retratos y composiciones similares a productos. Model
- Z-Image-Turbo-Realism LoRA (ejemplo de LoRA usado en el carril LoRA de este flujo de trabajo). Un adaptador ligero que impulsa el renderizado ultra-realista mientras preserva la alineación del prompt base Z-Image-Turbo; cargable sin reemplazar tu modelo base. Model
- Familia AuraFlow (referencia compatible con muestreo). El flujo de trabajo usa ganchos de muestreo estilo AuraFlow para generaciones estables de pocos pasos; consulta la referencia del pipeline para antecedentes sobre los planificadores AuraFlow y sus objetivos de diseño. Docs
Cómo usar el flujo de trabajo de Modelos Ajustados Z-Image en Comfyui
El gráfico está organizado en cuatro carriles de generación independientes que comparten un codificador de texto común y VAE. Usa un prompt para conducir todos los carriles, luego compara resultados guardados de cada rama.
- Modelo General
- La configuración compartida carga el codificador de texto y VAE. Introduce tu descripción en el
CLIPTextEncodepositivo (#75) y añade restricciones opcionales alCLIPTextEncodenegativo (#74). Esto mantiene el condicionamiento idéntico a través de las ramas para que puedas juzgar justamente cómo se comporta cada afinación. ElVAELoader(#21) proporciona el decodificador usado por todos los carriles para convertir latentes de nuevo en imágenes.
- La configuración compartida carga el codificador de texto y VAE. Introduce tu descripción en el
- Z-Image (Turbo Base)
- Este carril ejecuta el UNet oficial Z-Image-Turbo a través de
UNETLoader(#100) y lo parchea conModelSamplingAuraFlow(#76) para estabilidad de pocos pasos.CFGNorm(#67) estandariza el comportamiento de la guía sin clasificador para que el contraste y el detalle del sampler se mantengan predecibles a través de los prompts. UnEmptyLatentImage(#19) define el tamaño del lienzo, luegoKSampler(#78) genera latentes que son decodificados porVAEDecode(#79) y escritos porSaveImage(#102). Usa esta rama como tu línea base al evaluar otros Modelos Ajustados Z-Image.
- Este carril ejecuta el UNet oficial Z-Image-Turbo a través de
- Z-Image-Turbo + Realism LoRA
- Este carril inyecta un adaptador de estilo con
LoraLoaderModelOnly(#106) sobre elUNETLoaderbase (#82).ModelSamplingAuraFlow(#84) yCFGNorm(#64) mantienen las salidas nítidas mientras el LoRA impulsa el realismo sin abrumar el tema. Define la resolución conEmptyLatentImage(#71), genera conKSampler(#85), decodifica víaVAEDecode(#86), y guarda usandoSaveImage(#103). Si un LoRA se siente demasiado fuerte, reduce su peso aquí en lugar de sobre-editar tu prompt.
- Este carril inyecta un adaptador de estilo con
- Finetune BEYOND REALITY
- Esta ruta cambia a un punto de control comunitario con
UNETLoader(#88) para ofrecer un aspecto estilizado y de alto contraste.CFGNorm(#66) doma la guía para que la firma visual se mantenga limpia cuando cambies de muestreador o pasos. Establece tu tamaño objetivo enEmptyLatentImage(#72), renderiza conKSampler(#89), decodificaVAEDecode(#90), y guarda víaSaveImage(#104). Usa el mismo prompt que el carril base para ver cómo esta afinación interpreta la composición y la iluminación.
- Esta ruta cambia a un punto de control comunitario con
- Afinación Red Tide Dark Beast AIO
- Un punto de control orientado a la fantasía oscura se carga con
CheckpointLoaderSimple(#92), luego se normaliza conCFGNorm(#65). Este carril se inclina hacia paletas de colores sombríos y micro-contrastes más intensos mientras mantiene una buena conformidad con el prompt. Elige tu marco enEmptyLatentImage(#73), genera conKSampler(#93), decodifica conVAEDecode(#94), y exporta desdeSaveImage(#105). Es una forma práctica de probar estéticas más ásperas dentro de la misma configuración de Modelos Ajustados Z-Image.
- Un punto de control orientado a la fantasía oscura se carga con
Nodos clave en el flujo de trabajo de Modelos Ajustados Z-Image en Comfyui
ModelSamplingAuraFlow(#76, #84)- Propósito: parchea el modelo para usar una ruta de muestreo compatible con AuraFlow que es estable en conteos de pasos muy bajos. El control
shiftajusta sutilmente las trayectorias de muestreo; trátalo como un dial de finura que interactúa con tu elección de sampler y presupuesto de pasos. Para la mejor comparabilidad a través de carriles, mantén el mismo sampler y ajusta solo una variable (por ejemplo,shifto peso LoRA) por prueba. Referencia: antecedentes del pipeline AuraFlow y notas de programación. Docs
- Propósito: parchea el modelo para usar una ruta de muestreo compatible con AuraFlow que es estable en conteos de pasos muy bajos. El control
CFGNorm(#64, #65, #66, #67)- Propósito: normaliza la guía sin clasificador para que el contraste y el detalle no oscilen salvajemente cuando cambias modelos, pasos o planificadores. Aumenta su
strengthsi los reflejos se lavan o las texturas se sienten inconsistentes entre carriles; redúcelo si las imágenes comienzan a parecer excesivamente comprimidas. Manténlo similar a través de las ramas cuando quieras un A/B limpio de los Modelos Ajustados Z-Image.
- Propósito: normaliza la guía sin clasificador para que el contraste y el detalle no oscilen salvajemente cuando cambias modelos, pasos o planificadores. Aumenta su
LoraLoaderModelOnly(#106)- Propósito: inyecta un adaptador LoRA directamente en el UNet cargado sin alterar el punto de control base. El parámetro
strengthcontrola el impacto estilístico; valores más bajos preservan el realismo base mientras que valores más altos imponen el look del LoRA. Si un LoRA sobrepasa rostros o tipografía, reduce primero su peso, luego ajusta finamente la redacción del prompt.
- Propósito: inyecta un adaptador LoRA directamente en el UNet cargado sin alterar el punto de control base. El parámetro
KSampler(#78, #85, #89, #93)- Propósito: ejecuta el bucle de difusión real. Escoge un sampler y planificador que se emparejen bien con destilaciones de pocos pasos; muchos usuarios prefieren samplers estilo Euler con planificadores uniformes o de múltiples pasos para modelos de clase Turbo. Mantén las semillas fijas al comparar carriles, y cambia solo una variable a la vez para entender cómo se comporta cada afinación.
Extras opcionales
- Comienza con un prompt de estilo párrafo descriptivo y reutilízalo a través de todos los carriles para juzgar diferencias entre los Modelos Ajustados Z-Image; itera palabras de estilo solo después de elegir un carril favorito.
- Para modelos de clase Turbo, un CFG muy bajo o incluso cero a menudo produce los resultados más limpios; usa el prompt negativo solo cuando debas excluir elementos específicos.
- Mantén la misma resolución, sampler y semilla al hacer pruebas A/B; cambia el peso LoRA o
shiften pequeños incrementos para aislar causa y efecto. - Cada rama escribe su propia salida; los cuatro nodos
SaveImageestán etiquetados de manera única para que puedas comparar y curar rápidamente.
Enlaces para lectura adicional:
- Tarjeta del modelo Z-Image-Turbo: Tongyi-MAI/Z-Image-Turbo
- Informe técnico y métodos: Z-Image • Decoupled-DMD • DMDR
- Repositorio del proyecto: Tongyi-MAI/Z-Image
- Ejemplo de afinación: Nurburgring/BEYOND_REALITY_Z_IMAGE
- Ejemplo de LoRA: Z-Image-Turbo-Realism-LoRA
Reconocimientos
Este flujo de trabajo implementa y se basa en los siguientes trabajos y recursos. Agradecemos a los modelos de HuggingFace por el artículo por sus contribuciones y mantenimiento. Para detalles autorizados, por favor consulta la documentación original y los repositorios enlazados a continuación.
Recursos
- Modelos de HuggingFace:
Nota: El uso de los modelos, conjuntos de datos y código referenciados está sujeto a las respectivas licencias y términos proporcionados por sus autores y mantenedores.




