Qwen Image Edit 2511 para ComfyUI: edição de imagem única baseada em instruções e referência multi-imagem
Este fluxo de trabalho traz o Qwen Image Edit 2511 para o ComfyUI para edição precisa baseada em instruções que preserva a estrutura e identidade das suas imagens-fonte. Suporta tanto a edição de imagem única quanto o uso de referência multi-imagem, permitindo transferência de estilo, substituição de material ou objeto, mudanças de atributos e aprimoramento visual limpo com resultados naturais e coerentes.
Construído em um codificador de visão-linguagem mais um transformador de difusão, o gráfico converte instruções em inglês simples em edição de imagem consistente. Um Lightning LoRA opcional torna as gerações do Qwen Image Edit 2511 rápidas sem sacrificar o alinhamento, para que artistas e equipes de produto possam iterar rapidamente na edição criativa de imagens, reestilização de personagens e refinamento de conteúdo profissional.
Quer uma experiência mais simples, sem nós? Experimente a versão Playground para explorar Qwen Image Edit 2511 Playground sem usar nós do ComfyUI—basta fazer upload de uma imagem e editar com instruções de texto.
Modelos chave no fluxo de trabalho ComfyUI Qwen Image Edit 2511
- Qwen‑Image‑Edit‑2511. O transformador de difusão central para edição com consistência melhorada sobre 2509, projetado para seguir instruções enquanto mantém a identidade e a geometria estáveis. Hugging Face: Qwen/Qwen-Image-Edit-2511
- Qwen2.5‑VL‑7B‑Instruct. O codificador de visão-linguagem usado como a espinha dorsal de compreensão texto/imagem; alinha suas instruções com o contexto visual para edição baseada em instruções. Hugging Face: Qwen/Qwen2.5-VL-7B-Instruct
- Qwen Image VAE. O autoencoder variacional correspondente que mapeia entre o espaço de pixels e o espaço latente do modelo para reconstrução fiel. (Arquivos fornecidos via pacote Comfy‑Org.) Hugging Face: Comfy-Org/Qwen-Image_ComfyUI
- Qwen‑Image‑Edit‑2511‑Lightning (opcional). Um LoRA de aceleração de 4 etapas que acelera significativamente o sampler enquanto mantém as edições no ponto; ative quando quiser pré-visualizações rápidas ou edição de imagem única quase em tempo real. Hugging Face: lightx2v/Qwen-Image-Edit-2511-Lightning
Como usar o fluxo de trabalho ComfyUI Qwen Image Edit 2511
Este gráfico contém duas trilhas paralelas: “Imagens Múltiplas” para transferência de atributos/materiais entre imagens e “Imagem Única” para edição direta baseada em instruções. Ambas as trilhas compartilham os mesmos carregadores de modelo e lógica de sampler, e ambas terminam com nós de pré-visualização e salvamento. Escolha a trilha que corresponde à sua tarefa, escreva uma instrução clara e coloque na fila.
Imagens Múltiplas › Carregar imagem
Use este grupo para carregar duas imagens de referência: a primeira é sua base para editar e a segunda fornece o visual, material ou atributos para transferir. As imagens são redimensionadas automaticamente para tamanhos de trabalho equilibrados para preservar o layout e evitar artefatos durante a difusão. Se possível, escolha referências com enquadramento ou ponto de vista semelhantes para melhorar o alinhamento. Este caminho suporta tarefas como “substituir o material da cadeira na imagem da esquerda pelo da imagem da direita” enquanto mantém a forma e a estrutura.
Imagens Múltiplas › Prompt
Componha uma instrução curta e explícita que descreva o objetivo da edição e como a segunda imagem deve influenciar a primeira. Por exemplo: “Substitua o material da cadeira da Figura 1 pelo couro da Figura 2, mantenha a estrutura inalterada, combine a iluminação.” A instrução é alimentada para um codificador Qwen2.5-VL que fundamenta o texto nos visuais carregados para edição de imagem confiável. Evite objetivos conflitantes; especifique o que deve permanecer inalterado para resultados seguros de identidade.
Imagens Múltiplas › Carregar modelos
Este grupo carrega o modelo de difusão Qwen Image Edit 2511, o codificador Qwen2.5-VL e o Qwen Image VAE. Você pode opcionalmente habilitar o Lightning LoRA para acelerar a edição enquanto mantém o seguimento de instruções robusto. Deixe as escolhas de modelo como fornecidas pelo modelo a menos que você tenha um motivo para trocar as variantes.
Imagens Múltiplas › KSampler e saída
O sampler realiza a difusão controlada para realizar a edição solicitada, usando o condicionamento positivo da instrução e um condicionamento negativo zerado para reduzir mudanças não intencionais. O resultado é decodificado pelo VAE e automaticamente concatenado com as referências para uma pré-visualização lado a lado, facilitando a verificação se a edição de imagem única seguiu sua instrução. Salve o composto ou apenas a imagem editada conforme necessário.
Imagem Única › Carregar imagem
Solte uma imagem fonte para editar. Uma etapa de escalonamento a prepara para o tamanho de trabalho alvo para que a composição permaneça estável e pequenos detalhes permaneçam nítidos. Este é o caminho mais limpo para edição baseada em instruções quando você não precisa de uma imagem doadora de estilo ou material.
Imagem Única › Prompt
Escreva uma instrução direta que nomeie o assunto e a mudança exata. Bons padrões incluem “manter X, mudar Y,” “melhorar Z,” ou “reestilizar para [estilo] com a mesma composição.” A instrução é fundida com o contexto visual pelo codificador para que o modelo de difusão possa aplicar uma edição precisa de imagem única enquanto preserva a identidade e a geometria.
Imagem Única › Carregar modelos
Os carregadores de modelo inicializam Qwen Image Edit 2511, Qwen2.5-VL e o VAE. Opcionalmente, ative o Lightning LoRA para pré-visualizações mais rápidas e iteração rápida. Se você desativar o LoRA, o modelo base priorizará a máxima fidelidade e consistência.
Imagem Única › KSampler e saída
O sampler executa sua edição com condicionamento derivado do codificador e depois decodifica para uma imagem. Use a pré-visualização para avaliar se a edição satisfez a instrução sem se desviar do visual original. Salve a imagem final quando estiver satisfeito.
Nós chave no fluxo de trabalho ComfyUI Qwen Image Edit 2511
TextEncodeQwenImageEditPlusAdvance_lrzjason (#13, #64)
- Função: Empacota sua instrução com uma ou mais imagens de referência no condicionamento que guia o Qwen Image Edit 2511. Para tarefas de multi-imagem, refira-se explicitamente à primeira e segunda imagens na instrução para controlar o que é transferido. Se você ver edição excessiva, torne a instrução mais restrita (por exemplo, “não mude a pose ou iluminação”) e mantenha a descrição ancorada em objetos reais na imagem.
KSampler (#48, #72)
- Função: Conduz o processo de difusão que transforma o condicionamento na edição final. Com o Lightning LoRA habilitado, use muito poucos passos com baixa orientação para velocidade; sem ele, aumente os passos para máxima fidelidade. Se os resultados se desviarem, reduza a orientação; se a mudança for muito sutil, adicione um pouco mais de orientação ou passos.
LoraLoaderModelOnly (#49, #68)
- Função: Injeta o Qwen‑Image‑Edit‑2511‑Lightning LoRA para aceleração de 4 etapas. Mantenha o peso próximo ao seu padrão para resultados fiéis e desative-o quando quiser comparar com a qualidade do modelo base ou refinar uma edição complicada.
FluxKontextImageScale (#5, #6, #62)
- Função: Redimensiona as entradas para tamanhos de trabalho estáveis para que o codificador e o sampler vejam um contexto espacial consistente. Deixe ligado para a maioria dos casos; se você precisar preservar a resolução original exatamente, ajuste aqui primeiro e depois refine com o sampler.
Extras opcionais
- Escreva instruções que nomeiem o assunto e o escopo: “mudar a cor da jaqueta para azul-marinho, manter a textura do tecido e iluminação” resulta em edição de imagem mais confiável do que prompts de estilo vagos.
- Para transferência multi-imagem, escolha doadores com ponto de vista e iluminação semelhantes à imagem base; isso melhora a correspondência de material e estilo.
- Ao habilitar o Lightning para pré-visualizações rápidas, confirme o final com uma execução padrão se precisar da máxima fidelidade absoluta.
- Se uma edição tocar muito da moldura, adicione restrições como “manter o fundo inalterado” ou “preservar características faciais” para apertar o comportamento da edição de imagem única.
Referências
- Cartão de modelo Qwen‑Image‑Edit‑2511: Hugging Face
- Qwen2.5‑VL‑7B‑Instruct: Hugging Face
- Qwen Image VAE e arquivos empacotados para ComfyUI: Hugging Face
- Qwen‑Image‑Edit‑2511‑Lightning LoRA: Hugging Face
- Relatório técnico Qwen‑Image: arXiv
Agradecimentos
Este fluxo de trabalho implementa e constrói sobre os seguintes trabalhos e recursos. Agradecemos sinceramente ao Qwen pelo modelo Qwen-Image-Edit-2511 por suas contribuições e manutenção. Para detalhes autoritativos, consulte a documentação original e os repositórios vinculados abaixo.
Recursos
- Qwen/Qwen-Image-Edit-2511
- GitHub: QwenLM/Qwen-Image
- Hugging Face: Qwen/Qwen-Image-Edit-2511
- arXiv: 2508.02324
Nota: O uso dos modelos, conjuntos de dados e código referenciados está sujeito às respectivas licenças e termos fornecidos por seus autores e mantenedores.



