FireRed Image Edit 1.1: edición de imágenes rápida y basada en instrucciones en ComfyUI
FireRed Image Edit 1.1 es un flujo de trabajo de ComfyUI para la edición de imágenes dirigida y basada en instrucciones. Dale una imagen de origen y una instrucción en lenguaje natural, y aplicará cambios precisos mientras preserva la composición e identidad. Está impulsado por el transformador de difusión FireRed Image Edit 1.1 y guiado por un codificador de visión-lenguaje Qwen2.5-VL 7B para que tus ediciones sigan lo que muestra la imagen y lo que tu instrucción pretende.
El flujo de trabajo también incluye un modo turbo Lightning LoRA que reduce drásticamente los pasos de inferencia para una iteración rápida. Usa FireRed Image Edit 1.1 cuando necesites ediciones controlables y de alta fidelidad para cambios de vestuario, transferencias de estilo, ajustes de escena o refinamientos de detalles sutiles directamente dentro de ComfyUI.
Modelos clave en el flujo de trabajo ComfyUI FireRed Image Edit 1.1
- FireRed Image Edit 1.1 transformador de difusión. El generador principal especializado en ediciones de imagen siguiendo instrucciones; se acondiciona tanto en tu instrucción como en la imagen fuente para preservar el diseño y la identidad. Model card
- FireRed Image Edit 1.0 Lightning LoRA (8 pasos). Un adaptador de aceleración liviano que habilita el modo turbo, reduciendo los pasos de muestreo para vistas previas rápidas con fuerte adherencia a la edición. Model card
- Qwen2.5-VL 7B. Un modelo multimodal de visión-lenguaje utilizado aquí como el codificador para interpretar tu instrucción junto con el contenido de la imagen, produciendo un acondicionamiento robusto para el control de la edición. Model card
- Qwen Image VAE. El autoencoder de imagen utilizado para codificar la imagen de origen en latentes para la edición y decodificar el resultado final de nuevo a píxeles. Incluido en los activos de FireRed 1.0. Files
Cómo usar el flujo de trabajo ComfyUI FireRed Image Edit 1.1
A simple vista, el flujo de trabajo comienza cargando tu imagen de origen, la codifica en un latente, construye un acondicionamiento a partir de tu instrucción con Qwen2.5-VL 7B, y luego ejecuta FireRed Image Edit 1.1 a través de un muestreador para producir la imagen editada. Un solo interruptor turbo controla si el Lightning LoRA está activo, lo que también cambia la cantidad de pasos y la fuerza de guía para velocidad o calidad.
Modelo
Este grupo carga el transformador de difusión FireRed Image Edit 1.1 e inyecta opcionalmente el Lightning LoRA. Cuando el turbo está habilitado, el LoRA se aplica al modelo base para acelerar el muestreo. Un nodo de muestreo de modelo configura un cronograma adaptado para el transformador FireRed de modo que las ediciones permanezcan estables. Un paso de normalización de guía luego prepara el modelo para un acondicionamiento consistente a través de las instrucciones.
Instrucción
Este grupo es donde escribes la instrucción que impulsa FireRed Image Edit 1.1. El codificador Qwen2.5-VL 7B lee la imagen de origen junto con tu texto para entender tanto lo que está presente como lo que debe cambiar. Puedes añadir opcionalmente hasta dos imágenes de referencia más para dirigir el estilo, la ropa, la iluminación u otros atributos. El flujo de trabajo también incluye una ruta de codificador de acompañamiento que actúa como un canal negativo o de contrapeso para mantener las salidas limpias y en el objetivo.
Codificación de Imagen
Tu imagen de origen se redimensiona automáticamente a una resolución amigable con el modelo y luego se codifica en el espacio latente del VAE. Este latente se convierte en el punto de partida para la edición de imagen a imagen, permitiendo a FireRed Image Edit 1.1 preservar la composición, la geometría de la cámara y la identidad. El latente codificado fluye directamente al muestreador donde se aplican las ediciones.
Configuración de Pasos
Este grupo cambia la cantidad de pasos del muestreador según el interruptor turbo. Cuando el turbo está activado, los pasos se mantienen mínimos para vistas previas rápidas; cuando el turbo está desactivado, se utiliza una cantidad de pasos más alta para la máxima fidelidad. Usa el turbo para explorar direcciones rápidamente, luego desactívalo para el renderizado final de la más alta calidad.
Configuración de CFG
La fuerza de guía libre de clasificador también se cambia con el mismo interruptor turbo. Un valor de guía más bajo se empareja con el modo turbo para mantener las ediciones estables con menos pasos, mientras que un valor más alto se usa con el modelo completo para una adherencia más fuerte a la instrucción. El flujo de trabajo conecta esto automáticamente para que puedas concentrarte en la instrucción en lugar de gestionar parámetros minuciosamente.
Configuración de Muestreador
El muestreador combina el modelo FireRed parcheado, tu acondicionamiento positivo y negativo, y el latente codificado para producir la imagen editada. Puedes establecer una semilla para hacer que los resultados sean repetibles o variarla para explorar alternativas. La imagen decodificada se guarda en tu carpeta de salida con un prefijo claro para que puedas agrupar y comparar iteraciones fácilmente.
Nodos clave en el flujo de trabajo ComfyUI FireRed Image Edit 1.1
TextEncodeQwenImageEditPlus (Positivo) (#118)
Este nodo convierte tu instrucción de edición en lenguaje natural y de una a tres imágenes en acondicionamiento para FireRed Image Edit 1.1. Usa frases concisas y directivas como "cambiar la chaqueta a cuero rojo con cremalleras plateadas" o "convertir al estilo acuarela con bordes suaves." Las image2 y image3 opcionales pueden fijar referencias de estilo, vestuario o iluminación; mantenlas visualmente consistentes con tu objetivo. Si la edición es demasiado fuerte, reduce la intensidad descriptiva o añade restricciones clarificadoras.
¿Activar Lightning LoRA? (#153)
Este interruptor activa la ruta turbo Lightning LoRA. Cuando está activado, el flujo de trabajo cambia el modelo a la versión aumentada con LoRA, reduce el muestreo de aproximadamente 40 pasos a aproximadamente 8 pasos, y baja la guía para mantener los resultados estables a alta velocidad. Úsalo para iterar rápidamente sobre instrucciones y referencias, luego apágalo para la salida final de la más alta calidad.
LoraLoaderModelOnly (#151)
Este nodo inyecta el Lightning LoRA FireRed Image Edit 1.0 en el modelo base FireRed Image Edit 1.1. Si ajustas la fuerza del LoRA, recuerda que los valores más altos aumentan la intensidad de la edición pero pueden sobrepasar el estilo o introducir artefactos. Para ediciones críticas de identidad, mantén la fuerza moderada y confía en instrucciones más claras o imágenes de referencia adicionales en lugar de presionar demasiado el LoRA.
KSampler (#130)
El muestreador es donde se combinan la fuerza de la edición, la guía y los pasos. Con el turbo apagado, aumentar los steps mejora el detalle fino y reduce artefactos menores; con el turbo activado, mantén los pasos bajos para la velocidad y confía en la claridad de la instrucción y las referencias. Ajusta el cfg con moderación: valores más altos enfatizan la instrucción, mientras que los más bajos priorizan la fidelidad a la imagen fuente. Para cambios de escena mayores, aumenta el cfg y considera más pasos; para ajustes sutiles, reduce el cfg y menos pasos preservan la identidad.
Extras opcionales
- Escribe las ediciones como instrucciones claras, no descripciones completas de toda la imagen. "Reemplaza la camiseta con un blazer azul marino; mantén la pose y la iluminación" supera una narrativa larga.
- Usa las entradas opcionales
image2yimage3para anclar detalles de estilo o vestuario. Alinea el ángulo de la cámara y el encuadre con la fuente para la mejor transferencia. - Comienza con el turbo activado para explorar ideas, luego desactívalo para finalizar. Espera pequeñas diferencias debido a la mayor cantidad de pasos y guía más fuerte.
- Para la máxima preservación de identidad, mantén el
cfgconservador, usa una instrucción corta y específica, y proporciona una imagen de referencia cercana cuando sea posible. - Guarda una semilla fija una vez que te guste la dirección para poder hacer pruebas A/B solo de la instrucción o imágenes de referencia en diferentes ejecuciones.
Recursos
- Modelo FireRed Image Edit 1.1: FireRedTeam/FireRed-Image-Edit-1.1-ComfyUI
- Lightning LoRA y activos VAE: FireRedTeam/FireRed-Image-Edit-1.0-ComfyUI
- Codificador Qwen2.5-VL 7B: Qwen/Qwen2.5-VL-7B-Instruct
- Proyecto ComfyUI (referencias de nodos): comfy-org/ComfyUI
Agradecimientos
Este flujo de trabajo implementa y se basa en los siguientes trabajos y recursos. Agradecemos sinceramente a FireRedTeam por el Modelo de Difusión FireRed Image Edit 1.1, a FireRedTeam por el Lightning LoRA FireRed Image Edit 1.0, y a Comfy.org por el Flujo de Trabajo Oficial de Comfy.org por sus contribuciones y mantenimiento. Para detalles autorizados, por favor consulta la documentación original y los repositorios enlazados a continuación.
Recursos
- FireRedTeam/FireRed Image Edit 1.1 Diffusion Model
- GitHub: FireRedTeam/FireRed-Image-Edit
- Hugging Face: FireRedTeam/FireRed-Image-Edit-1.1-ComfyUI
- arXiv: 2602.13344
- FireRedTeam/FireRed Image Edit 1.0 Lightning LoRA
- GitHub: FireRedTeam/FireRed-Image-Edit
- Hugging Face: FireRedTeam/FireRed-Image-Edit-1.0-ComfyUI
- arXiv: 2602.13344
- Comfy.org/Comfy.org Official Workflow
- GitHub: Comfy-Org/workflow_templates
- Docs / Release Notes: FireRed Image Edit 1.1: Image Edit
Nota: El uso de los modelos, conjuntos de datos y código referenciados está sujeto a las respectivas licencias y términos proporcionados por sus autores y mantenedores.

