Qwen Image Edit 2509 é um fluxo de trabalho de edição multi-imagem para ComfyUI que funde 2–3 imagens de entrada sob um único prompt para criar edições precisas e misturas contínuas. É projetado para criadores que desejam compor objetos, reestilizar cenas, substituir elementos ou mesclar referências enquanto mantêm o controle intuitivo e previsível.
Este gráfico do ComfyUI combina o modelo de imagem Qwen com um codificador de texto ciente de edição para que você possa direcionar resultados com linguagem natural e uma ou mais referências visuais. Fora da caixa, o Qwen Image Edit 2509 lida com transferência de estilo, inserção de objetos e remixes de cena, produzindo resultados coerentes mesmo quando as fontes variam em aparência ou qualidade.
Este fluxo de trabalho segue um caminho claro de entradas para saída: você carrega 2–3 imagens, escreve um prompt, o gráfico codifica tanto o texto quanto as referências, a amostragem ocorre sobre uma base latente, e o resultado é decodificado e salvo.
Etapa 1 — Carregue e dimensione suas fontes
LoadImage
(#103) para a Imagem 1 e LoadImage
(#109) para a Imagem 2. A Imagem 2 atua como a tela base que receberá as edições.ImageScaleToTotalPixels
(#93 e #108) para que ambas as referências compartilhem um orçamento de pixels consistente. Isso estabiliza a composição e a transferência de estilo.LoadImage
na entrada image3
nos nós de codificação. O Qwen Image Edit 2509 aceita até três imagens para uma orientação mais rica.Etapa 2 — Escreva o prompt e defina a intenção
TextEncodeQwenImageEditPlus
(#104) combina seu prompt de texto com a Imagem 1 e a Imagem 2 para descrever o resultado que você deseja. Use linguagem natural para solicitar mesclagens, substituições ou sugestões de estilo.TextEncodeQwenImageEditPlus
(#106) permite que você se afaste de detalhes indesejados. Mantenha-o vazio para permanecer neutro ou adicione frases que suprimam artefatos ou estilos que você não deseja.Etapa 3 — Prepare o modelo
UnetLoaderGGUF
(#102) carrega a base Qwen Image Edit 2509 no formato GGUF para inferência eficiente.LoraLoaderModelOnly
(#89) aplica o LoRA Qwen‑Image‑Lightning. Aumente sua influência para edições mais marcantes ou reduza para atualizações mais conservadoras.Etapa 4 — Geração guiada
VAEEncode
(#88) e fornecida para KSampler
(#3) como o latente inicial. Isso torna a execução de imagem-para-imagem em vez de texto-puro-para-imagem.KSampler
(#3) funde as condições positivas e negativas com a tela latente para produzir o resultado editado. Trave a semente para reprodutibilidade ou varie-a para explorar alternativas.Etapa 5 — Decodifique e salve
VAEDecode
(#8) converte o latente final em uma imagem, e SaveImage
(#60) a escreve na sua pasta de saída. Os nomes dos arquivos refletem a execução para que você possa comparar versões facilmente.TextEncodeQwenImageEditPlus
(#104)Este nó cria a condição de edição positiva combinando seu prompt com até três imagens de referência via o codificador Qwen. Use-o para especificar o que deve aparecer, qual estilo adotar e quão fortemente as referências devem influenciar o resultado. Comece com um objetivo claro em uma única frase, depois adicione descritores de estilo ou dicas de câmera conforme necessário. Os ativos para o codificador são empacotados em Comfy-Org/Qwen-Image_ComfyUI.
TextEncodeQwenImageEditPlus
(#106)Este nó forma a condição negativa para prevenir traços indesejados. Adicione frases curtas que bloqueiem artefatos, suavização excessiva ou estilos incompatíveis. Mantenha-o mínimo para evitar conflito com a intenção positiva. Ele usa o mesmo codificador Qwen e pilha VAE que o caminho positivo.
UnetLoaderGGUF
(#102)Carrega o ponto de verificação Qwen Image Edit 2509 no formato GGUF para inferência amigável à VRAM. Quantização mais alta economiza memória mas pode afetar levemente detalhes finos; se você tiver espaço, tente uma quantização menos agressiva para maximizar a fidelidade. Referência de implementação: city96/ComfyUI-GGUF.
LoraLoaderModelOnly
(#89)Aplica o LoRA Qwen‑Image‑Lightning em cima do modelo base para acelerar a convergência e fortalecer edições. Aumente strength_model
para enfatizar o efeito deste LoRA ou diminua para orientação sutil. Página do modelo: lightx2v/Qwen-Image-Lightning. Referência do nó principal: comfyanonymous/ComfyUI.
ImageScaleToTotalPixels
(#93, #108)Redimensiona cada entrada para uma contagem total de pixels consistente usando reamostragem de alta qualidade. Aumentar o alvo de megapixels gera resultados mais nítidos ao custo de tempo e memória; diminuí-lo acelera a iteração. Mantenha ambas as referências em escalas semelhantes para ajudar o Qwen Image Edit 2509 a mesclar elementos de forma limpa. Referência do nó principal: comfyanonymous/ComfyUI.
KSampler
(#3)Executa as etapas de difusão que transformam a tela latente de acordo com suas condições. Ajuste as etapas e o amostrador para equilibrar velocidade e fidelidade, e varie a semente para explorar múltiplas composições a partir da mesma configuração. Para edições apertadas que preservam a estrutura da Imagem 2, mantenha a contagem de etapas moderada e confie no prompt e nas referências para controle. Referência do nó principal: comfyanonymous/ComfyUI.
Este fluxo de trabalho implementa e se baseia nos seguintes trabalhos e recursos. Agradecemos profundamente a RobbaW pelo Qwen Image Edit 2509 Workflow por suas contribuições e manutenção. Para detalhes autoritativos, consulte a documentação original e os repositórios vinculados abaixo.
Nota: O uso dos modelos, conjuntos de dados e código referenciados está sujeito às respectivas licenças e termos fornecidos por seus autores e mantenedores.
RunComfy é a principal ComfyUI plataforma, oferecendo ComfyUI online ambiente e serviços, juntamente com fluxos de trabalho do ComfyUI apresentando visuais impressionantes. RunComfy também oferece AI Playground, permitindo que artistas utilizem as mais recentes ferramentas de AI para criar arte incrível.