Qwen Image Edit 2511 para ComfyUI: edición de imagen única basada en instrucciones y referencia de múltiples imágenes
Este flujo de trabajo lleva Qwen Image Edit 2511 a ComfyUI para una edición precisa basada en instrucciones que preserva la estructura e identidad de tus imágenes fuente. Soporta tanto la edición de una sola imagen como el uso de referencia de múltiples imágenes, permitiendo transferencia de estilo, reemplazo de material u objeto, cambios de atributos y mejora visual limpia con resultados naturales y coherentes.
Construido sobre un codificador de visión-lenguaje más un transformador de difusión, el gráfico convierte instrucciones en inglés simple en edición de imagen consistente. Un Lightning LoRA opcional hace que las generaciones de Qwen Image Edit 2511 sean rápidas sin sacrificar la alineación, para que artistas y equipos de producto puedan iterar rápidamente en la edición creativa de imágenes, reestilización de personajes y refinamiento de contenido profesional.
¿Quieres una experiencia más simple, sin nodos? Prueba la versión Playground para explorar Qwen Image Edit 2511 Playground sin usar nodos de ComfyUI—solo sube una imagen y edita con instrucciones de texto.
Modelos clave en el flujo de trabajo de ComfyUI Qwen Image Edit 2511
- Qwen‑Image‑Edit‑2511. El transformador de difusión central para la edición con mejor consistencia sobre 2509, diseñado para seguir instrucciones mientras mantiene la identidad y la geometría estables. Hugging Face: Qwen/Qwen-Image-Edit-2511
- Qwen2.5‑VL‑7B‑Instruct. El codificador de visión-lenguaje utilizado como la columna vertebral de comprensión de texto/imagen; alinea tus instrucciones con el contexto visual para la edición basada en instrucciones. Hugging Face: Qwen/Qwen2.5-VL-7B-Instruct
- Qwen Image VAE. El autoencoder variacional que mapea entre el espacio de píxeles y el espacio latente del modelo para una reconstrucción fiel. (Archivos proporcionados a través del paquete Comfy‑Org.) Hugging Face: Comfy-Org/Qwen-Image_ComfyUI
- Qwen‑Image‑Edit‑2511‑Lightning (opcional). Un LoRA de aceleración de 4 pasos que acelera significativamente el muestreador mientras mantiene las ediciones en línea con las instrucciones; habilita cuando quieras vistas previas rápidas o edición de imagen única casi en tiempo real. Hugging Face: lightx2v/Qwen-Image-Edit-2511-Lightning
Cómo usar el flujo de trabajo de ComfyUI Qwen Image Edit 2511
Este gráfico contiene dos rutas paralelas: “Imágenes Múltiples” para transferencia de atributos/material entre imágenes y “Imagen Única” para edición directa basada en instrucciones. Ambas rutas comparten los mismos cargadores de modelo y lógica de muestreador, y ambas terminan con nodos de vista previa y guardado. Elige la ruta que coincida con tu tarea, escribe una instrucción clara y cola la ejecución.
Imágenes Múltiples › Cargar imagen
Usa este grupo para cargar dos imágenes de referencia: la primera es tu base para editar y la segunda proporciona el aspecto, material o atributos a transferir. Las imágenes se redimensionan automáticamente a tamaños de trabajo equilibrados para preservar el diseño y evitar artefactos durante la difusión. Si es posible, elige referencias con encuadre o punto de vista similar para mejorar la alineación. Este camino soporta tareas como “reemplazar el material de la silla en la imagen de la izquierda con el de la imagen de la derecha” mientras mantiene la forma y estructura.
Imágenes Múltiples › Instrucción
Compón una instrucción corta y explícita que describa el objetivo de la edición y cómo la segunda imagen debe influir en la primera. Por ejemplo: “Reemplazar el material de la silla de la Figura 1 con el cuero de la Figura 2, mantener el marco sin cambios, igualar la iluminación.” La instrucción se alimenta a un codificador Qwen2.5-VL que fundamenta el texto en los visuales cargados para una edición de imagen confiable. Evita objetivos conflictivos; especifica lo que debe permanecer sin cambios para resultados seguros en cuanto a identidad.
Imágenes Múltiples › Cargar modelos
Este grupo carga el modelo de difusión Qwen Image Edit 2511, el codificador Qwen2.5-VL y el VAE de Qwen Image. Puedes habilitar opcionalmente el LoRA Lightning para acelerar la edición mientras mantienes robusta la seguimiento de instrucciones. Deja las opciones de modelo como se proporcionan en la plantilla a menos que tengas una razón para intercambiar variantes.
Imágenes Múltiples › KSampler y salida
El muestreador realiza una difusión controlada para realizar la edición solicitada, usando el condicionamiento positivo de la instrucción y un condicionamiento negativo anulado para reducir cambios no intencionados. El resultado es decodificado por el VAE y concatenado automáticamente con las referencias para una vista previa lado a lado, facilitando verificar que la edición de imagen única siguió tu instrucción. Guarda el compuesto o solo la imagen editada según sea necesario.
Imagen Única › Cargar imagen
Coloca una imagen fuente para editar. Una etapa de escalado la prepara al tamaño de trabajo objetivo para que la composición se mantenga estable y los pequeños detalles permanezcan nítidos. Este es el camino más limpio para la edición basada en instrucciones cuando no necesitas una imagen donante de estilo o material.
Imagen Única › Instrucción
Escribe una instrucción directa que nombre el sujeto y el cambio exacto. Buenos patrones incluyen “mantener X, cambiar Y,” “mejorar Z,” o “reestilizar a [estilo] con la misma composición.” La instrucción se fusiona con el contexto visual por el codificador para que el modelo de difusión pueda aplicar una edición de imagen única precisa mientras preserva la identidad y la geometría.
Imagen Única › Cargar modelos
Los cargadores de modelo inicializan Qwen Image Edit 2511, Qwen2.5-VL, y el VAE. Opcionalmente habilita el Lightning LoRA para vistas previas más rápidas y rápida iteración. Si deshabilitas el LoRA, el modelo base priorizará la máxima fidelidad y consistencia.
Imagen Única › KSampler y salida
El muestreador ejecuta tu edición con el condicionamiento derivado del codificador y luego decodifica a una imagen. Usa la vista previa para evaluar si la edición satisfizo la instrucción sin desviarse del aspecto original. Guarda la imagen final cuando estés satisfecho.
Nodos clave en el flujo de trabajo de ComfyUI Qwen Image Edit 2511
TextEncodeQwenImageEditPlusAdvance_lrzjason (#13, #64)
- Rol: Empaqueta tu instrucción con una o más imágenes de referencia en el condicionamiento que guía Qwen Image Edit 2511. Para tareas de múltiples imágenes, refiere explícitamente a la primera y segunda imágenes en la instrucción para controlar lo que se transfiere. Si ves sobreedición, haz la instrucción más restringida (por ejemplo, “no cambiar pose o iluminación”) y mantén la descripción anclada a objetos reales en la imagen.
KSampler (#48, #72)
- Rol: Impulsa el proceso de difusión que convierte el condicionamiento en la edición final. Con el Lightning LoRA habilitado, usa muy pocos pasos con baja guía para velocidad; sin él, aumenta pasos para la máxima fidelidad. Si los resultados se desvían, baja la guía; si el cambio es demasiado sutil, añade un poco más de guía o pasos.
LoraLoaderModelOnly (#49, #68)
- Rol: Inyecta el LoRA Qwen‑Image‑Edit‑2511‑Lightning para aceleración de 4 pasos. Mantén el peso alrededor de su valor predeterminado para resultados fieles, y desactívalo cuando quieras comparar contra la calidad del modelo base o refinar una edición complicada.
FluxKontextImageScale (#5, #6, #62)
- Rol: Redimensiona entradas a tamaños de trabajo estables para que el codificador y el muestreador vean un contexto espacial consistente. Déjalo activado en la mayoría de los casos; si debes preservar la resolución original exactamente, ajusta aquí primero y luego refina con el muestreador.
Extras opcionales
- Escribe instrucciones que nombren el sujeto y el alcance: “cambiar color de la chaqueta a azul marino, mantener textura de la tela e iluminación” produce una edición de imagen más confiable que indicaciones de estilo vagas.
- Para transferencia de múltiples imágenes, elige donantes con punto de vista e iluminación similares a la imagen base; esto mejora la coincidencia de material y estilo.
- Al habilitar Lightning para vistas previas rápidas, confirma el final con una ejecución estándar si necesitas la máxima fidelidad absoluta.
- Si una edición toca demasiado del marco, añade restricciones como “mantener fondo sin cambios” o “preservar rasgos faciales” para ajustar el comportamiento de edición de imagen única.
Referencias
- Tarjeta del modelo Qwen‑Image‑Edit‑2511: Hugging Face
- Qwen2.5‑VL‑7B‑Instruct: Hugging Face
- Qwen Image VAE y archivos empaquetados para ComfyUI: Hugging Face
- Qwen‑Image‑Edit‑2511‑Lightning LoRA: Hugging Face
- Informe técnico de Qwen‑Image: arXiv
Agradecimientos
Este flujo de trabajo implementa y se basa en los siguientes trabajos y recursos. Agradecemos a Qwen por el modelo Qwen-Image-Edit-2511 por sus contribuciones y mantenimiento. Para detalles autorizados, por favor, consulta la documentación original y los repositorios vinculados a continuación.
Recursos
- Qwen/Qwen-Image-Edit-2511
- GitHub: QwenLM/Qwen-Image
- Hugging Face: Qwen/Qwen-Image-Edit-2511
- arXiv: 2508.02324
Nota: El uso de los modelos, conjuntos de datos y código referenciados está sujeto a las respectivas licencias y términos proporcionados por sus autores y mantenedores.


