Qwen Image Edit 2511 en ComfyUI | Edición de Instrucciones de Precisión

Qwen Image Edit 2511, image editing, instruction-based editing, single image edit, ComfyUI Workflow

Qwen Image Edit 2511 in ComfyUI | Precision Instruction Editing

Want to run this workflow?

Fully operational workflows
No missing nodes or models
No manual setups required
Features stunning visuals

Qwen Image Edit 2511, image editing, instruction-based editing, single image edit, ComfyUI Examples

qwen-image-edit-2511-in-comfyui-precision-instruction-editing-1325-example_01.webp

qwen-image-edit-2511-in-comfyui-precision-instruction-editing-1325-example_02.webp

qwen-image-edit-2511-in-comfyui-precision-instruction-editing-1325-example_03.webp

qwen-image-edit-2511-in-comfyui-precision-instruction-editing-1325-example_04.webp

qwen-image-edit-2511-in-comfyui-precision-instruction-editing-1325-example_05.webp

Qwen Image Edit 2511 para ComfyUI: edición de imagen única basada en instrucciones y referencia de múltiples imágenes#

Este flujo de trabajo lleva Qwen Image Edit 2511 a ComfyUI para una edición precisa basada en instrucciones que preserva la estructura e identidad de tus imágenes fuente. Soporta tanto la edición de una sola imagen como el uso de referencia de múltiples imágenes, permitiendo transferencia de estilo, reemplazo de material u objeto, cambios de atributos y mejora visual limpia con resultados naturales y coherentes.

Construido sobre un codificador de visión-lenguaje más un transformador de difusión, el gráfico convierte instrucciones en inglés simple en edición de imagen consistente. Un Lightning LoRA opcional hace que las generaciones de Qwen Image Edit 2511 sean rápidas sin sacrificar la alineación, para que artistas y equipos de producto puedan iterar rápidamente en la edición creativa de imágenes, reestilización de personajes y refinamiento de contenido profesional.

¿Quieres una experiencia más simple, sin nodos? Prueba la versión Playground para explorar Qwen Image Edit 2511 Playground sin usar nodos de ComfyUI—solo sube una imagen y edita con instrucciones de texto.

Modelos clave en el flujo de trabajo de ComfyUI Qwen Image Edit 2511#

Qwen‑Image‑Edit‑2511. El transformador de difusión central para la edición con mejor consistencia sobre 2509, diseñado para seguir instrucciones mientras mantiene la identidad y la geometría estables. Hugging Face: Qwen/Qwen-Image-Edit-2511
Qwen2.5‑VL‑7B‑Instruct. El codificador de visión-lenguaje utilizado como la columna vertebral de comprensión de texto/imagen; alinea tus instrucciones con el contexto visual para la edición basada en instrucciones. Hugging Face: Qwen/Qwen2.5-VL-7B-Instruct
Qwen Image VAE. El autoencoder variacional que mapea entre el espacio de píxeles y el espacio latente del modelo para una reconstrucción fiel. (Archivos proporcionados a través del paquete Comfy‑Org.) Hugging Face: Comfy-Org/Qwen-Image_ComfyUI
Qwen‑Image‑Edit‑2511‑Lightning (opcional). Un LoRA de aceleración de 4 pasos que acelera significativamente el muestreador mientras mantiene las ediciones en línea con las instrucciones; habilita cuando quieras vistas previas rápidas o edición de imagen única casi en tiempo real. Hugging Face: lightx2v/Qwen-Image-Edit-2511-Lightning

Cómo usar el flujo de trabajo de ComfyUI Qwen Image Edit 2511#

Este gráfico contiene dos rutas paralelas: “Imágenes Múltiples” para transferencia de atributos/material entre imágenes y “Imagen Única” para edición directa basada en instrucciones. Ambas rutas comparten los mismos cargadores de modelo y lógica de muestreador, y ambas terminan con nodos de vista previa y guardado. Elige la ruta que coincida con tu tarea, escribe una instrucción clara y cola la ejecución.

Imágenes Múltiples › Cargar imagen#

Usa este grupo para cargar dos imágenes de referencia: la primera es tu base para editar y la segunda proporciona el aspecto, material o atributos a transferir. Las imágenes se redimensionan automáticamente a tamaños de trabajo equilibrados para preservar el diseño y evitar artefactos durante la difusión. Si es posible, elige referencias con encuadre o punto de vista similar para mejorar la alineación. Este camino soporta tareas como “reemplazar el material de la silla en la imagen de la izquierda con el de la imagen de la derecha” mientras mantiene la forma y estructura.

Imágenes Múltiples › Instrucción#

Compón una instrucción corta y explícita que describa el objetivo de la edición y cómo la segunda imagen debe influir en la primera. Por ejemplo: “Reemplazar el material de la silla de la Figura 1 con el cuero de la Figura 2, mantener el marco sin cambios, igualar la iluminación.” La instrucción se alimenta a un codificador Qwen2.5-VL que fundamenta el texto en los visuales cargados para una edición de imagen confiable. Evita objetivos conflictivos; especifica lo que debe permanecer sin cambios para resultados seguros en cuanto a identidad.

Imágenes Múltiples › Cargar modelos#

Este grupo carga el modelo de difusión Qwen Image Edit 2511, el codificador Qwen2.5-VL y el VAE de Qwen Image. Puedes habilitar opcionalmente el LoRA Lightning para acelerar la edición mientras mantienes robusta la seguimiento de instrucciones. Deja las opciones de modelo como se proporcionan en la plantilla a menos que tengas una razón para intercambiar variantes.

Imágenes Múltiples › KSampler y salida#

El muestreador realiza una difusión controlada para realizar la edición solicitada, usando el condicionamiento positivo de la instrucción y un condicionamiento negativo anulado para reducir cambios no intencionados. El resultado es decodificado por el VAE y concatenado automáticamente con las referencias para una vista previa lado a lado, facilitando verificar que la edición de imagen única siguió tu instrucción. Guarda el compuesto o solo la imagen editada según sea necesario.

Imagen Única › Cargar imagen#

Coloca una imagen fuente para editar. Una etapa de escalado la prepara al tamaño de trabajo objetivo para que la composición se mantenga estable y los pequeños detalles permanezcan nítidos. Este es el camino más limpio para la edición basada en instrucciones cuando no necesitas una imagen donante de estilo o material.

Imagen Única › Instrucción#

Escribe una instrucción directa que nombre el sujeto y el cambio exacto. Buenos patrones incluyen “mantener X, cambiar Y,” “mejorar Z,” o “reestilizar a [estilo] con la misma composición.” La instrucción se fusiona con el contexto visual por el codificador para que el modelo de difusión pueda aplicar una edición de imagen única precisa mientras preserva la identidad y la geometría.

Imagen Única › Cargar modelos#

Los cargadores de modelo inicializan Qwen Image Edit 2511, Qwen2.5-VL, y el VAE. Opcionalmente habilita el Lightning LoRA para vistas previas más rápidas y rápida iteración. Si deshabilitas el LoRA, el modelo base priorizará la máxima fidelidad y consistencia.

Imagen Única › KSampler y salida#

El muestreador ejecuta tu edición con el condicionamiento derivado del codificador y luego decodifica a una imagen. Usa la vista previa para evaluar si la edición satisfizo la instrucción sin desviarse del aspecto original. Guarda la imagen final cuando estés satisfecho.

Nodos clave en el flujo de trabajo de ComfyUI Qwen Image Edit 2511#

TextEncodeQwenImageEditPlusAdvance_lrzjason (#13, #64)

Rol: Empaqueta tu instrucción con una o más imágenes de referencia en el condicionamiento que guía Qwen Image Edit 2511. Para tareas de múltiples imágenes, refiere explícitamente a la primera y segunda imágenes en la instrucción para controlar lo que se transfiere. Si ves sobreedición, haz la instrucción más restringida (por ejemplo, “no cambiar pose o iluminación”) y mantén la descripción anclada a objetos reales en la imagen.

KSampler (#48, #72)

Rol: Impulsa el proceso de difusión que convierte el condicionamiento en la edición final. Con el Lightning LoRA habilitado, usa muy pocos pasos con baja guía para velocidad; sin él, aumenta pasos para la máxima fidelidad. Si los resultados se desvían, baja la guía; si el cambio es demasiado sutil, añade un poco más de guía o pasos.

LoraLoaderModelOnly (#49, #68)

Rol: Inyecta el LoRA Qwen‑Image‑Edit‑2511‑Lightning para aceleración de 4 pasos. Mantén el peso alrededor de su valor predeterminado para resultados fieles, y desactívalo cuando quieras comparar contra la calidad del modelo base o refinar una edición complicada.

FluxKontextImageScale (#5, #6, #62)

Rol: Redimensiona entradas a tamaños de trabajo estables para que el codificador y el muestreador vean un contexto espacial consistente. Déjalo activado en la mayoría de los casos; si debes preservar la resolución original exactamente, ajusta aquí primero y luego refina con el muestreador.

Extras opcionales#

Escribe instrucciones que nombren el sujeto y el alcance: “cambiar color de la chaqueta a azul marino, mantener textura de la tela e iluminación” produce una edición de imagen más confiable que indicaciones de estilo vagas.
Para transferencia de múltiples imágenes, elige donantes con punto de vista e iluminación similares a la imagen base; esto mejora la coincidencia de material y estilo.
Al habilitar Lightning para vistas previas rápidas, confirma el final con una ejecución estándar si necesitas la máxima fidelidad absoluta.
Si una edición toca demasiado del marco, añade restricciones como “mantener fondo sin cambios” o “preservar rasgos faciales” para ajustar el comportamiento de edición de imagen única.

Referencias

Tarjeta del modelo Qwen‑Image‑Edit‑2511: Hugging Face
Qwen2.5‑VL‑7B‑Instruct: Hugging Face
Qwen Image VAE y archivos empaquetados para ComfyUI: Hugging Face
Qwen‑Image‑Edit‑2511‑Lightning LoRA: Hugging Face
Informe técnico de Qwen‑Image: arXiv

Agradecimientos#

Este flujo de trabajo implementa y se basa en los siguientes trabajos y recursos. Agradecemos a Qwen por el modelo Qwen-Image-Edit-2511 por sus contribuciones y mantenimiento. Para detalles autorizados, por favor, consulta la documentación original y los repositorios vinculados a continuación.

Recursos#

Qwen/Qwen-Image-Edit-2511
- GitHub: QwenLM/Qwen-Image
- Hugging Face: Qwen/Qwen-Image-Edit-2511
- arXiv: 2508.02324

Nota: El uso de los modelos, conjuntos de datos y código referenciados está sujeto a las respectivas licencias y términos proporcionados por sus autores y mantenedores.

Want More ComfyUI Workflows?

Face Detailer | Arreglar Rostros

Use Face Detailer primero para la restauración facial, seguido del Modelo 4x UltraSharp para un escalado superior.

AnimateDiff + ControlNet + AutoMask | Estilo cómic

Cambie el estilo de los videos sin esfuerzo, convirtiendo personajes realistas en anime mientras mantiene intactos los fondos originales.

SUPIR | Mejorador de Imágenes/Videos Fotorrealista

SUPIR permite la restauración fotorrealista de imágenes, funciona con el modelo SDXL y admite la mejora mediante indicaciones de texto.

Face Restore + ControlNet + Reactor | Restaurar fotos antiguas

Revive fotos desvanecidas en recuerdos vibrantes, preservando cada detalle para una reminiscencia preciada.

Mesh Graphormer ControlNet | Corregir manos

Mesh Graphormer ControlNet corrige las manos malformadas en las imágenes mientras preserva el resto.

ByteDance USO | Generador unificado de estilo y sujeto

ByteDance USO hace que la fusión de sujeto y estilo sea simple y poderosa.

Wan2.2 Animate | Foto a Video de Movimiento Realista

Convierte imágenes en personajes realistas en movimiento con movimiento natural del cuerpo y la cara.

OmniGen | Imagen-a-Imagen

OmniGen: Modificar Imágenes Basadas en Imágenes de Referencia e Indicaciones

Soporte

Recursos

Legal

RunComfy

RunComfy es la principal ComfyUI plataforma, ofreciendo ComfyUI en línea entorno y servicios, junto con flujos de trabajo de ComfyUI con impresionantes imágenes. RunComfy también ofrece AI Models, permitiendo a los artistas aprovechar las últimas herramientas de AI para crear arte increíble.

Qwen Image Edit 2511 | Flujo de Trabajo de Edición de Imagen Inteligente