FireRed Image Edit 1.1: edição de imagem rápida e baseada em instruções no ComfyUI
FireRed Image Edit 1.1 é um fluxo de trabalho ComfyUI para edição de imagem direcionada e baseada em instruções. Forneça uma imagem de origem e uma instrução em linguagem natural, e ele aplicará mudanças precisas enquanto preserva a composição e a identidade. É alimentado pelo transformador de difusão FireRed Image Edit 1.1 e guiado por um encoder de visão-linguagem Qwen2.5-VL 7B para que suas edições sigam o que a imagem mostra e o que seu prompt pretende.
O fluxo de trabalho também inclui um modo turbo Lightning LoRA que reduz dramaticamente as etapas de inferência para iteração rápida. Use o FireRed Image Edit 1.1 quando precisar de edições controláveis e de alta fidelidade para mudanças de roupa, transferências de estilo, ajustes de cena ou refinamentos sutis de detalhes diretamente no ComfyUI.
Modelos-chave no fluxo de trabalho Comfyui FireRed Image Edit 1.1
- Transformador de difusão FireRed Image Edit 1.1. O gerador principal especializado em edições de imagem seguindo instruções; ele se condiciona tanto no seu prompt quanto na imagem de origem para preservar o layout e a identidade. Model card
- FireRed Image Edit 1.0 Lightning LoRA (8-step). Um adaptador de aceleração leve que permite o modo turbo, reduzindo as etapas de amostragem para pré-visualizações rápidas com forte adesão à edição. Model card
- Qwen2.5-VL 7B. Um modelo multimodal de visão-linguagem usado aqui como o encoder para interpretar sua instrução junto com o conteúdo da imagem, produzindo um condicionamento robusto para controle de edição. Model card
- Qwen Image VAE. O autoencoder de imagem usado para codificar a imagem de origem em latentes para edição e decodificar o resultado final de volta para pixels. Incluído nos ativos FireRed 1.0. Files
Como usar o fluxo de trabalho Comfyui FireRed Image Edit 1.1
Em resumo, o fluxo de trabalho começa carregando sua imagem de origem, codifica-a em um latente, constrói o condicionamento a partir de sua instrução com o Qwen2.5‑VL 7B, e então executa o FireRed Image Edit 1.1 através de um sampler para produzir a imagem editada. Um único botão de turbo controla se o Lightning LoRA está ativo, o que também altera a contagem de etapas e a força de orientação para velocidade ou qualidade.
Modelo
Este grupo carrega o transformador de difusão FireRed Image Edit 1.1 e opcionalmente injeta o Lightning LoRA. Quando o turbo está ativado, o LoRA é aplicado ao modelo base para acelerar a amostragem. Um nó de amostragem de modelo configura um cronograma adaptado para o transformador FireRed para que as edições permaneçam estáveis. Uma etapa de normalização de orientação então prepara o modelo para condicionamento consistente em todos os prompts.
Prompt
Este grupo é onde você escreve a instrução que dirige o FireRed Image Edit 1.1. O encoder Qwen2.5‑VL 7B lê a imagem de origem junto com seu texto para compreender tanto o que está presente quanto o que deve mudar. Você pode opcionalmente adicionar até duas imagens de referência para direcionar estilo, roupas, iluminação ou outros atributos. O fluxo de trabalho também inclui um caminho de encoder acompanhante que atua como um canal negativo ou de contrabalanço para manter as saídas limpas e no alvo.
Codificação de Imagem
Sua imagem de origem é automaticamente redimensionada para uma resolução amigável ao modelo e então codificada no espaço latente VAE. Este latente se torna o ponto de partida para a edição de imagem para imagem, permitindo que o FireRed Image Edit 1.1 preserve a composição, geometria da câmera e identidade. O latente codificado flui diretamente para o sampler onde as edições são aplicadas.
Configuração de Etapas
Este grupo alterna a contagem de etapas do sampler com base no botão turbo. Quando o turbo está ativado, as etapas são mantidas mínimas para pré-visualizações rápidas; quando o turbo está desativado, uma contagem de etapas mais alta é usada para máxima fidelidade. Use o turbo para explorar direções rapidamente, depois desative-o para a renderização final de mais alta qualidade.
Configuração de CFG
A força de orientação sem classificador também é alternada pelo mesmo botão turbo. Um valor de orientação mais baixo se emparelha com o modo turbo para manter as edições estáveis sob menos etapas, enquanto um valor mais alto é usado com o modelo completo para uma adesão mais forte ao prompt. O fluxo de trabalho conecta isso automaticamente para que você possa se concentrar na instrução em vez de gerenciar parâmetros.
Configuração de Sampler
O sampler combina o modelo FireRed modificado, seu condicionamento positivo e negativo, e o latente codificado para produzir a imagem editada. Você pode definir uma semente para tornar os resultados repetíveis ou variá-la para explorar alternativas. A imagem decodificada é salva na sua pasta de saída com um prefixo claro para que você possa agrupar e comparar iterações facilmente.
Nós-chave no fluxo de trabalho Comfyui FireRed Image Edit 1.1
TextEncodeQwenImageEditPlus (Positivo) (#118)
Este nó transforma sua instrução de edição em linguagem natural e uma a três imagens em condicionamento para o FireRed Image Edit 1.1. Use frases concisas e diretas como "mude a jaqueta para couro vermelho com zíperes prateados" ou "converta para estilo aquarela com bordas suaves." image2 e image3 opcionais podem fixar referências de estilo, roupa ou iluminação; mantenha-as visualmente consistentes com seu objetivo. Se a edição for muito forte, reduza a intensidade descritiva ou adicione restrições esclarecedoras.
Ativar Lightning LoRA? (#153)
Este botão ativa o caminho turbo Lightning LoRA. Quando ativado, o fluxo de trabalho alterna o modelo para a versão aumentada com LoRA, reduz a amostragem de cerca de 40 etapas para aproximadamente 8 etapas e diminui a orientação para manter os resultados estáveis em alta velocidade. Use-o para iterar rapidamente prompts e referências, depois desative-o para a saída final de mais alta qualidade.
LoraLoaderModelOnly (#151)
Este nó injeta o FireRed Image Edit 1.0 Lightning LoRA no modelo base FireRed Image Edit 1.1. Se você ajustar a força do LoRA, lembre-se de que valores mais altos aumentam a intensidade da edição, mas podem ultrapassar o estilo ou introduzir artefatos. Para edições críticas de identidade, mantenha a força moderada e confie em instruções mais claras ou imagens de referência adicionais em vez de forçar demais o LoRA.
KSampler (#130)
O sampler é onde a força da edição, a orientação e as etapas se encontram. Com o turbo desativado, aumentar steps melhora os detalhes finos e reduz artefatos menores; com o turbo ativado, mantenha as etapas baixas para velocidade e confie na clareza do prompt e nas referências. Ajuste cfg com moderação: valores mais altos enfatizam a instrução, enquanto valores mais baixos priorizam a fidelidade à imagem de origem. Para mudanças de cena significativas, aumente cfg e considere mais etapas; para ajustes sutis, reduza cfg e menos etapas preservam a identidade.
Extras opcionais
- Escreva edições como instruções claras, não descrições completas da imagem inteira. "Substitua a camiseta por um blazer azul-marinho; mantenha a pose e a iluminação" supera uma narrativa longa.
- Use as entradas opcionais
image2eimage3para ancorar detalhes de estilo ou roupas. Combine o ângulo da câmera e o enquadramento com a fonte para a melhor transferência. - Comece com o turbo ativado para explorar ideias, depois desative o turbo para finalizar. Espere pequenas diferenças devido à contagem de etapas mais alta e orientação mais forte.
- Para máxima preservação de identidade, mantenha
cfgconservador, use uma instrução curta e específica, e forneça uma imagem de referência estreitamente correspondente quando possível. - Salve uma semente fixa assim que você gostar da direção para que você possa testar A/B apenas a instrução ou imagens de referência em execuções.
Recursos
- Modelo FireRed Image Edit 1.1: FireRedTeam/FireRed-Image-Edit-1.1-ComfyUI
- Lightning LoRA e ativos VAE: FireRedTeam/FireRed-Image-Edit-1.0-ComfyUI
- Encoder Qwen2.5‑VL 7B: Qwen/Qwen2.5-VL-7B-Instruct
- Projeto ComfyUI (referências de nós): comfy-org/ComfyUI
Reconhecimentos
Este fluxo de trabalho implementa e se baseia nos seguintes trabalhos e recursos. Agradecemos sinceramente à FireRedTeam pelo Modelo de Difusão FireRed Image Edit 1.1, à FireRedTeam pelo Lightning LoRA FireRed Image Edit 1.0, e à Comfy.org pelo Workflow Oficial Comfy.org por suas contribuições e manutenção. Para detalhes autorizados, consulte a documentação original e os repositórios abaixo.
Recursos
- FireRedTeam/FireRed Image Edit 1.1 Diffusion Model
- GitHub: FireRedTeam/FireRed-Image-Edit
- Hugging Face: FireRedTeam/FireRed-Image-Edit-1.1-ComfyUI
- arXiv: 2602.13344
- FireRedTeam/FireRed Image Edit 1.0 Lightning LoRA
- GitHub: FireRedTeam/FireRed-Image-Edit
- Hugging Face: FireRedTeam/FireRed-Image-Edit-1.0-ComfyUI
- arXiv: 2602.13344
- Comfy.org/Comfy.org Official Workflow
- GitHub: Comfy-Org/workflow_templates
- Docs / Release Notes: FireRed Image Edit 1.1: Image Edit
Nota: O uso dos modelos, conjuntos de dados e código referenciados está sujeito às respectivas licenças e termos fornecidos por seus autores e mantenedores.

