Fluxo de Trabalho de Edição de Imagens Qwen no ComfyUI | Inpainting, Reiluminação, Transferência de Estilo

Edição de Imagens Qwen para ComfyUI: Edição de fotos baseada em prompts, substituição e reiluminação

Este fluxo de trabalho oferece edições de imagem rápidas e controláveis impulsionadas pela família Qwen. Com um único prompt, você pode fazer inpainting, substituir fundos, inserir ou remover objetos e aplicar reiluminação cinematográfica enquanto preserva detalhes locais. A Edição de Imagens Qwen é ideal para artistas e criadores que desejam transformações precisas sem lutar com gráficos de nós complexos.

O gráfico é organizado em etapas simples: carregar modelos, carregar uma imagem, escrever prompts, depois amostrar e salvar. Ele vem com um Lightning LoRA opcional para edições ultra-rápidas em 4 etapas, para que você possa iterar rapidamente e definir o visual desejado.

Modelos-chave no fluxo de trabalho de Edição de Imagens Qwen no ComfyUI

Modelo de difusão de Edição de Imagens Qwen Núcleo de edição de imagens UNet usado para edições guiadas por instruções. Empacotado para o ComfyUI como qwen_image_edit_fp8_e4m3fn.safetensors em Comfy-Org/Qwen-Image-Edit_ComfyUI.
Codificador de texto multimodal Qwen 2.5 VL 7B Codificador de texto multimodal que interpreta instruções de edição e condiciona o modelo. Disponibilizado como qwen_2.5_vl_7b_fp8_scaled.safetensors em Comfy-Org/Qwen-Image_ComfyUI.
VAE de Imagem Qwen Codec latente adaptado para modelos de Imagem Qwen, melhorando a qualidade de reconstrução. Distribuído como qwen_image_vae.safetensors em Comfy-Org/Qwen-Image_ComfyUI.
Qwen-Image-Lightning LoRA (opcional) LoRA otimizado para velocidade que permite edições de alta qualidade em apenas 4 etapas. Disponível como Qwen-Image-Lightning-4steps-V1.0.safetensors em lightx2v/Qwen-Image-Lightning.

Como usar o fluxo de trabalho de Edição de Imagens Qwen no ComfyUI

Passo 1 – Carregar modelos

O gráfico carrega o UNet de edição com UNETLoader (#37), o codificador de texto com CLIPLoader (#38), e o codec latente com VAELoader (#39). Se você quiser uma iteração mais rápida, ative o opcional LoraLoaderModelOnly (#89) para aplicar o Lightning LoRA no modelo base. ModelSamplingAuraFlow (#66) e CFGNorm (#75) preparam o amostrador para que o modelo de Edição de Imagens Qwen siga os prompts sem exagerar nos detalhes.

Passo 2 – Carregar imagem para edição

Use LoadImage (#78) para selecionar a foto que você deseja modificar. A imagem passa por ImageScaleToTotalPixels (#93) para manter a resolução em uma faixa de qualidade amigável, o que ajuda a Edição de Imagens Qwen a evitar artefatos de entradas muito grandes. VAEEncode (#88) converte pixels em latentes para edição eficiente enquanto preserva a estrutura.

Passo 3 – Prompt

Escreva sua instrução em TextEncodeQwenImageEdit (#76) como uma diretiva positiva. Exemplos incluem “substitua o fundo por uma paisagem urbana ao pôr do sol,” “remova a pessoa ao fundo,” ou “luz dourada suave à esquerda.” Use o segundo TextEncodeQwenImageEdit (#77) como um guia negativo quando precisar evitar mudanças, por exemplo “não altere o rosto do sujeito” ou “mantenha a cor da jaqueta.” Ambos os codificadores veem sua imagem carregada e o VAE para que o condicionamento permaneça alinhado com o conteúdo.

Amostragem e saída

KSampler (#3) executa a edição usando o modelo corrigido e seu condicionamento. Se o Lightning LoRA estiver ativado, você pode convergir com muito poucas etapas; caso contrário, use mais etapas para máxima fidelidade. O latente editado é decodificado por VAEDecode (#8) e gravado em disco via SaveImage (#60).

Nós-chave no fluxo de trabalho de Edição de Imagens Qwen no ComfyUI

`TextEncodeQwenImageEdit` (#76)

Codifica a instrução principal que orienta a edição. Prefira verbos diretos como “substituir,” “inserir,” “remover,” “recolorir,” e “reiluminar.” Se a mudança for local, nomeie a região ou objeto explicitamente. Mantenha os prompts concisos; listas longas de tags de estilo raramente são necessárias.

`TextEncodeQwenImageEdit` (#77)

Fornece orientação negativa ou protetora. Use para dizer ao modelo o que evitar ou para preservar atributos-chave. Bons padrões: “manter tom de pele,” “não mudar a composição,” “ignorar texto de fundo.”

`LoraLoaderModelOnly` (#89)

Aplica o Qwen-Image-Lightning LoRA para iteração rápida. Ative quando precisar de resultados quase instantâneos. Reduza substancialmente as etapas do amostrador quando este LoRA estiver ativo para manter edições nítidas.

`ImageScaleToTotalPixels` (#93)

Reduz entradas superdimensionadas para um orçamento de megapixels alvo para estabilizar a qualidade. Use quando as imagens de origem forem muito grandes ou contiverem compressão pesada; geralmente melhora a suavidade das bordas e reduz halos.

`CFGNorm` (#75)

Normaliza o comportamento de orientação livre de classificadores para que o modelo siga os prompts sem criar artefatos. Se você vir supersaturação ou “superedição,” reduza levemente a força; se as edições parecerem tímidas, aumente um pouco.

`KSampler` (#3)

Executa o loop de difusão. Comece com etapas modestas para fp8 e aumente apenas se a edição estiver incompleta. Mantenha a orientação moderada; valores muito altos podem lavar regiões preservadas. Quando o Lightning LoRA estiver ativado, use muito poucas etapas para capturar seu benefício de velocidade.

Extras opcionais

Descreva edições de forma simples. A Edição de Imagens Qwen responde melhor a instruções curtas e acionáveis como “deixe o céu nublado e adicione chuva” ou “troque o texto do outdoor para ‘RunComfy’ em branco.”
Para substituição de fundo, especifique tanto a nova cena quanto o humor, por exemplo “substitua o fundo por um horizonte ao entardecer, névoa laranja, luzes da cidade fracas.”
Para trabalho com objetos, combine uma ação e colocação: “insira um guarda-chuva vermelho na mão direita do sujeito,” ou “remova a lixeira à esquerda.”
Para reiluminação, nomeie direção, qualidade e intensidade: “luz principal suave da direita da câmera, luz de contorno sutil, tom quente.”
Se os resultados parecerem superprocessados, reduza a orientação ou desative o LoRA; se as edições forem muito fracas, aumente ligeiramente as etapas ou fortaleça a instrução.

Agradecimentos

Este fluxo de trabalho implementa e constrói sobre os seguintes trabalhos e recursos. Agradecemos sinceramente à QwenLM por Qwen-Image-Edit, QwenLM por Qwen-Image, e ComfyOrg por Exemplo de Fluxo de Trabalho Nativo do ComfyUI por suas contribuições e manutenção. Para detalhes autoritativos, consulte a documentação original e os repositórios vinculados abaixo.

Recursos

Referência de Edição de Imagens Qwen/Comfy
- GitHub: QwenLM/Qwen-Image
- Hugging Face: Qwen/Qwen-Image-Edit
- arXiv: Relatório Técnico Qwen-Image
- Docs / Notas de Lançamento: Exemplo de Fluxo de Trabalho Nativo do ComfyUI Qwen-Image-Edit

Nota: O uso dos modelos, conjuntos de dados e código referenciados está sujeito às respectivas licenças e termos fornecidos por seus autores e mantenedores.

Want More ComfyUI Workflows?

Wan 2.2 | Líder em Geração de Vídeo Open-Source

Disponível agora! Melhor precisão + movimento mais suave.

Wan 2.2 + Lightx2v V2 | Ultra Rápido I2V & T2V

Configuração Dual Light LoRA, 4X mais rápida.

Wan 2.2 Geração de Imagens | Pacote de Fluxo de Trabalho 2-em-1

MoE Mix + Somente-Baixo com aumento de resolução. Escolha um.

Wan 2.2 Lightning T2V I2V | 4 Etapas Ultra Rápido

Wan 2.2 agora 20x mais rápido! T2V + I2V em 4 etapas.

Wan 2.2 Low Vram | Wrapper Kijai

Low VRAM. Sem mais espera. Wrapper Kijai incluído.

Stable Diffusion 3.5 vs FLUX.1

Compare Stable Diffusion 3.5 e FLUX.1 em um fluxo de trabalho ComfyUI.

Omni Kontext | Integração de Cena Sem Costura

Cenas perfeitas. Estilo único. Identidade preservada. Kontext mantém a realidade.

Face to Many | 3D, Emoji, Pixel, Clay, Toy, Video game

utiliza modelos LoRA, ControlNet e InstantID para transformações avançadas de rosto para muitos

Suporte

Recursos

Legal

RunComfy

RunComfy é a principal ComfyUI plataforma, oferecendo ComfyUI online ambiente e serviços, juntamente com fluxos de trabalho do ComfyUI apresentando visuais impressionantes. RunComfy também oferece AI Models, permitindo que artistas utilizem as mais recentes ferramentas de AI para criar arte incrível.

Edição de Imagens Qwen | Edição de Fotos com IA Precisa

Edição de Imagens Qwen para ComfyUI: Edição de fotos baseada em prompts, substituição e reiluminação

Modelos-chave no fluxo de trabalho de Edição de Imagens Qwen no ComfyUI

Como usar o fluxo de trabalho de Edição de Imagens Qwen no ComfyUI

Passo 1 – Carregar modelos

Passo 2 – Carregar imagem para edição

Passo 3 – Prompt

Amostragem e saída

Nós-chave no fluxo de trabalho de Edição de Imagens Qwen no ComfyUI

TextEncodeQwenImageEdit (#76)

TextEncodeQwenImageEdit (#77)

LoraLoaderModelOnly (#89)

ImageScaleToTotalPixels (#93)

CFGNorm (#75)

KSampler (#3)

Extras opcionais

Agradecimentos

Recursos

Want More ComfyUI Workflows?

Wan 2.2 | Líder em Geração de Vídeo Open-Source

Wan 2.2 + Lightx2v V2 | Ultra Rápido I2V & T2V

Wan 2.2 Geração de Imagens | Pacote de Fluxo de Trabalho 2-em-1

Wan 2.2 Lightning T2V I2V | 4 Etapas Ultra Rápido

Wan 2.2 Low Vram | Wrapper Kijai

Stable Diffusion 3.5 vs FLUX.1

Omni Kontext | Integração de Cena Sem Costura

Face to Many | 3D, Emoji, Pixel, Clay, Toy, Video game

`TextEncodeQwenImageEdit` (#76)

`TextEncodeQwenImageEdit` (#77)

`LoraLoaderModelOnly` (#89)

`ImageScaleToTotalPixels` (#93)

`CFGNorm` (#75)

`KSampler` (#3)