logo
RunComfy
ComfyUIPlaygroundPricing
discord logo
ComfyUI>Flujos de trabajo>Nunchaku Qwen Image | Editor de Imágenes Múltiples

Nunchaku Qwen Image | Editor de Imágenes Múltiples

Workflow Name: RunComfy/Nunchaku-Qwen-Image
Workflow ID: 0000...1301
Con este flujo de trabajo, puedes fusionar, transformar y mejorar múltiples imágenes de referencia para lograr composiciones coherentes y de alta calidad. Utiliza el modelo Qwen para ofrecer una avanzada mezcla de imágenes múltiples, control de fondo y ajustes de estilo impulsados por indicaciones. Ideal para diseñadores y artistas digitales que buscan un control creativo refinado, simplifica ediciones complejas mientras mantiene el detalle natural. Perfecto para crear visuales dinámicos o experimentar con múltiples fuentes sin esfuerzo.

Edición y composición de imágenes múltiples de Nunchaku Qwen Image para ComfyUI

Nunchaku Qwen Image es un flujo de trabajo de edición y composición de imágenes múltiples impulsado por indicaciones para ComfyUI. Acepta hasta tres imágenes de referencia, te permite especificar cómo deben mezclarse o transformarse, y produce un resultado coherente guiado por lenguaje natural. Los casos de uso típicos incluyen la fusión de sujetos, el reemplazo de fondos o la transferencia de estilos y detalles de una imagen a otra.

Construido alrededor de la familia de imágenes Qwen, este flujo de trabajo brinda a artistas, diseñadores y creadores un control preciso mientras se mantiene rápido y predecible. También incluye una ruta de edición de una sola imagen y una ruta de texto a imagen pura, para que puedas generar, refinar y componer dentro de un solo pipeline de Nunchaku Qwen Image.

Nota: Por favor, selecciona tipos de máquina dentro del rango de Medium a 2XLarge. El uso de tipos de máquina 2XLarge Plus o 3XLarge no está soportado y resultará en un fallo de ejecución.

Modelos clave en el flujo de trabajo de Comfyui Nunchaku Qwen Image

  • Nunchaku Qwen Image Edit 2509. Pesos de difusión/DiT afinados para edición de imágenes guiada por indicaciones y transferencia de atributos. Fuerte en ediciones localizadas, intercambios de objetos y cambios de fondo. Model card

  • Nunchaku Qwen Image (base). Generador base utilizado por la rama de texto a imagen para síntesis creativa sin una foto de origen. Model card

  • Qwen2.5-VL 7B codificador de texto. Modelo de lenguaje multimodal que interpreta indicaciones y las alinea con características visuales para edición y generación. Model page

  • Qwen Image VAE. Autoencoder variacional utilizado para codificar imágenes fuente en latentes y decodificar resultados finales con color y detalle fieles. Assets

Cómo usar el flujo de trabajo de Comfyui Nunchaku Qwen Image

Este gráfico contiene tres rutas independientes que comparten el mismo lenguaje visual y lógica de muestreo. Usa una rama a la vez dependiendo de si estás editando múltiples imágenes, refinando una sola imagen o generando desde texto.

Nunchaku-qwen-image-edit-2509 (edición y composición de imágenes múltiples)

Esta rama carga el modelo de edición con NunchakuQwenImageDiTLoader (#115), lo enruta a través de ModelSamplingAuraFlow (#66) y CFGNorm (#75), luego sintetiza con KSampler (#3). Sube hasta tres imágenes usando LoadImage (#78, #106, #108). La referencia principal se codifica con VAEEncode (#88) para establecer el lienzo, y ImageScaleToTotalPixels (#93) mantiene las entradas dentro de un rango de tamaño estable.

Escribe tu instrucción en TextEncodeQwenImageEditPlus (#111) y, si es necesario, coloca eliminaciones o restricciones en el emparejado TextEncodeQwenImageEditPlus (#110). Refiera a las fuentes explícitamente, por ejemplo: “El perro en la imagen 1 lleva el sombrero verde de la imagen 2 y las gafas de la imagen 3.” Para un tamaño de salida personalizado, puedes reemplazar el latente codificado con EmptySD3LatentImage (#112). Los resultados se decodifican con VAEDecode (#8) y se guardan con SaveImage (#60).

Nunchaku-qwen-image-edit (refinamiento de una sola imagen)

Elige esto cuando desees limpiezas específicas, cambios de fondo o ajustes de estilo en una imagen. El modelo se carga mediante NunchakuQwenImageDiTLoader (#120), adaptado por ModelSamplingAuraFlow (#125) y CFGNorm (#123), y muestreado por KSampler (#127). Importa tu foto con LoadImage (#129); se normaliza con ImageScaleToTotalPixels (#130) y se codifica con VAEEncode (#131).

Proporciona tu instrucción en TextEncodeQwenImageEdit (#121) y una orientación contraria opcional en TextEncodeQwenImageEdit (#122) para mantener o eliminar elementos. La rama decodifica con VAEDecode (#124) y escribe archivos a través de SaveImage (#128).

Nunchaku-qwen-image (texto a imagen)

Usa esta rama para crear nuevas imágenes desde cero con el modelo base. NunchakuQwenImageDiTLoader (#146) alimenta ModelSamplingAuraFlow (#138). Introduce tus indicaciones positivas y negativas en CLIPTextEncode (#143) y CLIPTextEncode (#137). Establece tu lienzo con EmptySD3LatentImage (#136), luego genera con KSampler (#141), decodifica usando VAEDecode (#142), y guarda con SaveImage (#147).

Nodos clave en el flujo de trabajo de Comfyui Nunchaku Qwen Image

NunchakuQwenImageDiTLoader (#115)
Carga los pesos de imagen Qwen y la variante utilizada por la rama. Selecciona el modelo de edición para ediciones guiadas por fotos o el modelo base para texto a imagen. Cuando la VRAM lo permite, las variantes de mayor precisión o resolución pueden ofrecer más detalle; las variantes más ligeras priorizan la velocidad.

TextEncodeQwenImageEditPlus (#111)
Impulsa ediciones de imágenes múltiples al analizar tu instrucción y vincularla con hasta tres referencias. Mantén las directivas explícitas sobre qué imagen contribuye con qué atributo. Usa frases concisas y evita objetivos contradictorios para mantener las ediciones enfocadas.

TextEncodeQwenImageEditPlus (#110)
Actúa como el codificador negativo o de restricción emparejado para la rama de imágenes múltiples. Úsalo para excluir objetos, estilos o artefactos que no deseas que aparezcan. Esto a menudo ayuda a preservar la composición mientras se eliminan superposiciones de UI o elementos no deseados.

TextEncodeQwenImageEdit (#121)
Instrucción positiva para la rama de edición de una sola imagen. Describe el resultado deseado, las cualidades de la superficie y la composición en términos claros. Aspira a una a tres oraciones que especifiquen la escena y los cambios.

TextEncodeQwenImageEdit (#122)
Indicación negativa o de restricción para la rama de edición de una sola imagen. Enumera elementos o características a evitar, o describe elementos a eliminar de la imagen fuente. Esto es útil para limpiar texto perdido, logotipos o elementos de interfaz.

ImageScaleToTotalPixels (#93)
Evita que las entradas de gran tamaño desestabilicen los resultados al escalar a un recuento total de píxeles objetivo. Úsalo para armonizar resoluciones de origen dispares antes de componer. Si notas una nitidez inconsistente entre las fuentes, acércalas en tamaño efectivo aquí.

ModelSamplingAuraFlow (#66)
Aplica un programa de muestreo DiT/flujo coincidente afinado para los modelos de imagen Qwen. Si las salidas se ven oscuras, borrosas o carecen de estructura, aumenta el desplazamiento del programa para estabilizar el tono global; si se ven planas, reduce el desplazamiento para buscar detalle adicional.

KSampler (#3)
El muestreador principal donde equilibras velocidad, fidelidad y variedad estocástica. Ajusta los pasos y la escala de orientación para consistencia versus creatividad, elige un método de muestreo y bloquea una semilla cuando deseas reproducibilidad exacta a través de ejecuciones.

CFGNorm (#75)
Normaliza la orientación libre de clasificador para reducir la sobresaturación o explosiones de contraste a escalas de orientación más altas. Déjalo en el camino como se proporciona; ayuda a mantener el color y la exposición constantes mientras iteras en indicaciones.

Extras opcionales

  • Para obtener los mejores resultados de imágenes múltiples, elige fuentes con perspectiva e iluminación similares; el modelo de edición de Nunchaku Qwen Image se centra entonces en el contenido en lugar de corregir la geometría.
  • Refiera a las fuentes por orden (“imagen 1”, “imagen 2”, “imagen 3”) y sea explícito sobre qué atributos se transfieren a dónde.
  • Cuando las salidas se desvían hacia lo oscuro o borroso, empuja el desplazamiento de ModelSamplingAuraFlow hacia arriba; cuando desees textura adicional, prueba un desplazamiento ligeramente más bajo.
  • Para establecer una resolución específica, intercambia el latente codificado por EmptySD3LatentImage en la rama que estés usando.
  • Usa indicaciones negativas para eliminar texto de la UI, marcas de agua u objetos no deseados antes de invertir en un estilo detallado; esto mantiene las ediciones de Nunchaku Qwen Image limpias desde el principio.

Agradecimientos

Este flujo de trabajo implementa y se basa en los siguientes trabajos y recursos. Agradecemos a Nunchaku por el flujo de trabajo Qwen-Image (ComfyUI-nunchaku) por sus contribuciones y mantenimiento. Para detalles autorizados, por favor, consulta la documentación original y los repositorios enlazados a continuación.

Recursos

  • Nunchaku/Qwen-Image
    • GitHub: nunchaku-tech/ComfyUI-nunchaku
    • Hugging Face: nunchaku-tech/nunchaku-qwen-image
    • arXiv: SVDQuant: Absorbing Outliers by Low-Rank Components for 4-Bit Diffusion Models
    • Docs / Release Notes: Nunchaku Qwen Image Source

Nota: El uso de los modelos, conjuntos de datos y código referenciados está sujeto a las respectivas licencias y términos proporcionados por sus autores y mantenedores.

Want More ComfyUI Workflows?

IPAdapter Plus (V2) | Fusionar Imágenes

IPAdapter Plus (V2) | Fusionar Imágenes

Use varios métodos de fusión con IPAdapter Plus para un control preciso y eficiente de la combinación de imágenes.

IPAdapter Plus (V2) | Estilo y composición

IPAdapter Plus (V2) | Estilo y composición

IPAdapter Plus permite una transferencia efectiva de estilo y composición, funcionando como un LoRA de 1 imagen.

IPAdapter Plus (V2) | Transferencia de estilo con una imagen

IPAdapter Plus (V2) | Transferencia de estilo con una imagen

Use IPAdapter Plus y ControlNet para una transferencia de estilo precisa con una sola imagen de referencia.

IPAdapter Plus (V2) | Cambiar ropa

IPAdapter Plus (V2) | Cambiar ropa

Use IPAdapter Plus para la creación de sus modelos de moda, cambiando fácilmente de atuendos y estilos

DynamiCrafter | Imágenes a Video

Probado para la generación de videos en bucle e interpolación de fotogramas. Mejor que la generación de video de código cerrado en ciertos escenarios

IPAdapter Plus (V2) Máscara de atención | Imagen a video

Aproveche la máscara de atención de IPAdapter Plus para un control preciso del proceso de generación de imágenes.

CogVideoX-5B | Modelo Avanzado de Texto a Video

CogVideoX-5B: Modelo avanzado de texto a video para la generación de videos de alta calidad.

Face Restore + ControlNet + Reactor | Restaurar fotos antiguas

Face Restore + ControlNet + Reactor | Restaurar fotos antiguas

Revive fotos desvanecidas en recuerdos vibrantes, preservando cada detalle para una reminiscencia preciada.

Síguenos
  • LinkedIn
  • Facebook
  • Instagram
  • Twitter
Soporte
  • Discord
  • Correo electrónico
  • Estado del sistema
  • afiliado
Recursos
  • ComfyUI en línea gratis
  • Guías de ComfyUI
  • RunComfy API
  • Tutoriales de ComfyUI
  • Nodos de ComfyUI
  • Aprende más
Legal
  • Términos de servicio
  • Política de privacidad
  • Política de cookies
RunComfy
Derechos de autor 2025 RunComfy. Todos los derechos reservados.

RunComfy es la principal ComfyUI plataforma, ofreciendo ComfyUI en línea entorno y servicios, junto con flujos de trabajo de ComfyUI con impresionantes imágenes. RunComfy también ofrece AI Playground, permitiendo a los artistas aprovechar las últimas herramientas de AI para crear arte increíble.