Este flujo de trabajo ofrece ediciones de imagen rápidas y controlables impulsadas por la familia Qwen. Con un solo prompt, puedes hacer inpainting, reemplazar fondos, insertar o eliminar objetos, y aplicar relighting cinematográfico mientras preservas los detalles locales. Qwen Image Edit es ideal para artistas y creadores que quieren transformaciones precisas sin lidiar con gráficos de nodos complejos.
El gráfico está organizado en pasos simples: cargar modelos, subir una imagen, escribir prompts, luego muestrear y guardar. Viene con un Lightning LoRA opcional para ediciones ultrarrápidas en 4 pasos, para que puedas iterar rápidamente y fijar el aspecto que deseas.
qwen_image_edit_fp8_e4m3fn.safetensors
en .qwen_2.5_vl_7b_fp8_scaled.safetensors
en .qwen_image_vae.safetensors
en .Qwen-Image-Lightning-4steps-V1.0.safetensors
en .El gráfico carga el UNet de edición con UNETLoader
(#37), el codificador de texto con CLIPLoader
(#38), y el códec latente con VAELoader
(#39). Si deseas una iteración más rápida, activa el LoraLoaderModelOnly
opcional (#89) para aplicar el Lightning LoRA sobre el modelo base. ModelSamplingAuraFlow
(#66) y CFGNorm
(#75) preparan el muestreador para que el modelo Qwen Image Edit siga los prompts limpiamente sin sobrecargar detalles.
Usa LoadImage
(#78) para seleccionar la foto que deseas modificar. La imagen pasa por ImageScaleToTotalPixels
(#93) para mantener la resolución en un rango amigable con la calidad, lo que ayuda a Qwen Image Edit a evitar artefactos de entradas muy grandes. VAEEncode
(#88) convierte píxeles a latentes para una edición eficiente mientras preserva la estructura.
Escribe tu instrucción en TextEncodeQwenImageEdit
(#76) como una directiva positiva. Ejemplos incluyen “reemplazar el fondo por un paisaje urbano al atardecer,” “eliminar la persona en el fondo,” o “luz clave dorada suave desde la izquierda.” Usa el segundo TextEncodeQwenImageEdit
(#77) como guía negativa cuando necesites evitar cambios, por ejemplo “no alterar la cara del sujeto” o “mantener el color de la chaqueta.” Ambos codificadores ven tu imagen subida y el VAE para que el condicionamiento se mantenga alineado con el contenido.
KSampler
(#3) ejecuta la edición usando el modelo parcheado y tu condicionamiento. Si el Lightning LoRA está habilitado, puedes converger con muy pocos pasos; de lo contrario, usa más pasos para obtener la máxima fidelidad. El latente editado es decodificado por VAEDecode
(#8) y escrito en disco a través de SaveImage
(#60).
TextEncodeQwenImageEdit
(#76)Codifica la instrucción principal que impulsa la edición. Favorece verbos directos como “reemplazar,” “insertar,” “eliminar,” “recolorar,” y “reluzar.” Si el cambio debe ser local, nombra explícitamente la región u objeto. Mantén los prompts concisos; las largas listas de etiquetas de estilo rara vez son necesarias.
TextEncodeQwenImageEdit
(#77)Proporciona orientación negativa o protectora. Úsalo para decirle al modelo qué evitar o para preservar atributos clave. Buenos patrones: “mantener tono de piel,” “no cambiar la composición,” “ignorar texto de fondo.”
LoraLoaderModelOnly
(#89)Aplica el Qwen-Image-Lightning LoRA para una rápida iteración. Enciéndelo cuando necesites resultados casi instantáneos. Reduce los pasos del muestreador sustancialmente cuando este LoRA está activo para mantener ediciones nítidas.
ImageScaleToTotalPixels
(#93)Reduce el tamaño de las entradas sobredimensionadas a un presupuesto de megapíxeles objetivo para estabilizar la calidad. Úsalo cuando las imágenes de origen sean muy grandes o contengan compresión pesada; a menudo mejora la suavidad de los bordes y reduce los halos.
CFGNorm
(#75)Normaliza el comportamiento de la guía sin clasificador para que el modelo siga los prompts sin generar artefactos. Si ves sobresaturación o “sobre-edición,” baja la intensidad ligeramente; si las ediciones parecen tímidas, súbela un poco.
KSampler
(#3)Ejecuta el bucle de difusión. Comienza con pasos modestos para fp8 y aumenta solo si la edición está incompleta. Mantén la guía moderada; valores muy altos pueden deslavar regiones preservadas. Cuando el Lightning LoRA está activado, usa muy pocos pasos para capturar su beneficio de velocidad.
Este flujo de trabajo implementa y se basa en los siguientes trabajos y recursos. Agradecemos a QwenLM por Qwen-Image-Edit, QwenLM por Qwen-Image, y ComfyOrg por ComfyUI Native Workflow Example por sus contribuciones y mantenimiento. Para detalles autorizados, por favor consulta la documentación original y los repositorios enlazados a continuación.
Nota: El uso de los modelos, conjuntos de datos y código referenciados está sujeto a las respectivas licencias y términos proporcionados por sus autores y mantenedores.
RunComfy es la principal ComfyUI plataforma, ofreciendo ComfyUI en línea entorno y servicios, junto con flujos de trabajo de ComfyUI con impresionantes imágenes. RunComfy también ofrece AI Playground, permitiendo a los artistas aprovechar las últimas herramientas de AI para crear arte increíble.