Edição de Imagens Qwen para ComfyUI: Edição de fotos baseada em prompts, substituição e reiluminação
Este fluxo de trabalho oferece edições de imagem rápidas e controláveis impulsionadas pela família Qwen. Com um único prompt, você pode fazer inpainting, substituir fundos, inserir ou remover objetos e aplicar reiluminação cinematográfica enquanto preserva detalhes locais. A Edição de Imagens Qwen é ideal para artistas e criadores que desejam transformações precisas sem lutar com gráficos de nós complexos.
O gráfico é organizado em etapas simples: carregar modelos, carregar uma imagem, escrever prompts, depois amostrar e salvar. Ele vem com um Lightning LoRA opcional para edições ultra-rápidas em 4 etapas, para que você possa iterar rapidamente e definir o visual desejado.
Modelos-chave no fluxo de trabalho de Edição de Imagens Qwen no ComfyUI
- Modelo de difusão de Edição de Imagens Qwen Núcleo de edição de imagens UNet usado para edições guiadas por instruções. Empacotado para o ComfyUI como
qwen_image_edit_fp8_e4m3fn.safetensorsem Comfy-Org/Qwen-Image-Edit_ComfyUI. - Codificador de texto multimodal Qwen 2.5 VL 7B Codificador de texto multimodal que interpreta instruções de edição e condiciona o modelo. Disponibilizado como
qwen_2.5_vl_7b_fp8_scaled.safetensorsem Comfy-Org/Qwen-Image_ComfyUI. - VAE de Imagem Qwen Codec latente adaptado para modelos de Imagem Qwen, melhorando a qualidade de reconstrução. Distribuído como
qwen_image_vae.safetensorsem Comfy-Org/Qwen-Image_ComfyUI. - Qwen-Image-Lightning LoRA (opcional) LoRA otimizado para velocidade que permite edições de alta qualidade em apenas 4 etapas. Disponível como
Qwen-Image-Lightning-4steps-V1.0.safetensorsem lightx2v/Qwen-Image-Lightning.
Como usar o fluxo de trabalho de Edição de Imagens Qwen no ComfyUI
Passo 1 – Carregar modelos
O gráfico carrega o UNet de edição com UNETLoader (#37), o codificador de texto com CLIPLoader (#38), e o codec latente com VAELoader (#39). Se você quiser uma iteração mais rápida, ative o opcional LoraLoaderModelOnly (#89) para aplicar o Lightning LoRA no modelo base. ModelSamplingAuraFlow (#66) e CFGNorm (#75) preparam o amostrador para que o modelo de Edição de Imagens Qwen siga os prompts sem exagerar nos detalhes.
Passo 2 – Carregar imagem para edição
Use LoadImage (#78) para selecionar a foto que você deseja modificar. A imagem passa por ImageScaleToTotalPixels (#93) para manter a resolução em uma faixa de qualidade amigável, o que ajuda a Edição de Imagens Qwen a evitar artefatos de entradas muito grandes. VAEEncode (#88) converte pixels em latentes para edição eficiente enquanto preserva a estrutura.
Passo 3 – Prompt
Escreva sua instrução em TextEncodeQwenImageEdit (#76) como uma diretiva positiva. Exemplos incluem “substitua o fundo por uma paisagem urbana ao pôr do sol,” “remova a pessoa ao fundo,” ou “luz dourada suave à esquerda.” Use o segundo TextEncodeQwenImageEdit (#77) como um guia negativo quando precisar evitar mudanças, por exemplo “não altere o rosto do sujeito” ou “mantenha a cor da jaqueta.” Ambos os codificadores veem sua imagem carregada e o VAE para que o condicionamento permaneça alinhado com o conteúdo.
Amostragem e saída
KSampler (#3) executa a edição usando o modelo corrigido e seu condicionamento. Se o Lightning LoRA estiver ativado, você pode convergir com muito poucas etapas; caso contrário, use mais etapas para máxima fidelidade. O latente editado é decodificado por VAEDecode (#8) e gravado em disco via SaveImage (#60).
Nós-chave no fluxo de trabalho de Edição de Imagens Qwen no ComfyUI
TextEncodeQwenImageEdit (#76)
Codifica a instrução principal que orienta a edição. Prefira verbos diretos como “substituir,” “inserir,” “remover,” “recolorir,” e “reiluminar.” Se a mudança for local, nomeie a região ou objeto explicitamente. Mantenha os prompts concisos; listas longas de tags de estilo raramente são necessárias.
TextEncodeQwenImageEdit (#77)
Fornece orientação negativa ou protetora. Use para dizer ao modelo o que evitar ou para preservar atributos-chave. Bons padrões: “manter tom de pele,” “não mudar a composição,” “ignorar texto de fundo.”
LoraLoaderModelOnly (#89)
Aplica o Qwen-Image-Lightning LoRA para iteração rápida. Ative quando precisar de resultados quase instantâneos. Reduza substancialmente as etapas do amostrador quando este LoRA estiver ativo para manter edições nítidas.
ImageScaleToTotalPixels (#93)
Reduz entradas superdimensionadas para um orçamento de megapixels alvo para estabilizar a qualidade. Use quando as imagens de origem forem muito grandes ou contiverem compressão pesada; geralmente melhora a suavidade das bordas e reduz halos.
CFGNorm (#75)
Normaliza o comportamento de orientação livre de classificadores para que o modelo siga os prompts sem criar artefatos. Se você vir supersaturação ou “superedição,” reduza levemente a força; se as edições parecerem tímidas, aumente um pouco.
KSampler (#3)
Executa o loop de difusão. Comece com etapas modestas para fp8 e aumente apenas se a edição estiver incompleta. Mantenha a orientação moderada; valores muito altos podem lavar regiões preservadas. Quando o Lightning LoRA estiver ativado, use muito poucas etapas para capturar seu benefício de velocidade.
Extras opcionais
- Descreva edições de forma simples. A Edição de Imagens Qwen responde melhor a instruções curtas e acionáveis como “deixe o céu nublado e adicione chuva” ou “troque o texto do outdoor para ‘RunComfy’ em branco.”
- Para substituição de fundo, especifique tanto a nova cena quanto o humor, por exemplo “substitua o fundo por um horizonte ao entardecer, névoa laranja, luzes da cidade fracas.”
- Para trabalho com objetos, combine uma ação e colocação: “insira um guarda-chuva vermelho na mão direita do sujeito,” ou “remova a lixeira à esquerda.”
- Para reiluminação, nomeie direção, qualidade e intensidade: “luz principal suave da direita da câmera, luz de contorno sutil, tom quente.”
- Se os resultados parecerem superprocessados, reduza a orientação ou desative o LoRA; se as edições forem muito fracas, aumente ligeiramente as etapas ou fortaleça a instrução.
Agradecimentos
Este fluxo de trabalho implementa e constrói sobre os seguintes trabalhos e recursos. Agradecemos sinceramente à QwenLM por Qwen-Image-Edit, QwenLM por Qwen-Image, e ComfyOrg por Exemplo de Fluxo de Trabalho Nativo do ComfyUI por suas contribuições e manutenção. Para detalhes autoritativos, consulte a documentação original e os repositórios vinculados abaixo.
Recursos
- Referência de Edição de Imagens Qwen/Comfy
- GitHub: QwenLM/Qwen-Image
- Hugging Face: Qwen/Qwen-Image-Edit
- arXiv: Relatório Técnico Qwen-Image
- Docs / Notas de Lançamento: Exemplo de Fluxo de Trabalho Nativo do ComfyUI Qwen-Image-Edit
Nota: O uso dos modelos, conjuntos de dados e código referenciados está sujeito às respectivas licenças e termos fornecidos por seus autores e mantenedores.

