Qwen Image Edit 2511 em ComfyUI | Edição de Instruções de Precisão

Qwen Image Edit 2511, image editing, instruction-based editing, single image edit, ComfyUI Workflow

Qwen Image Edit 2511 in ComfyUI | Precision Instruction Editing

Want to run this workflow?

Fully operational workflows
No missing nodes or models
No manual setups required
Features stunning visuals

Qwen Image Edit 2511, image editing, instruction-based editing, single image edit, ComfyUI Examples

qwen-image-edit-2511-in-comfyui-precision-instruction-editing-1325-example_01.webp

qwen-image-edit-2511-in-comfyui-precision-instruction-editing-1325-example_02.webp

qwen-image-edit-2511-in-comfyui-precision-instruction-editing-1325-example_03.webp

qwen-image-edit-2511-in-comfyui-precision-instruction-editing-1325-example_04.webp

qwen-image-edit-2511-in-comfyui-precision-instruction-editing-1325-example_05.webp

Qwen Image Edit 2511 para ComfyUI: edição de imagem única baseada em instruções e referência multi-imagem#

Este fluxo de trabalho traz o Qwen Image Edit 2511 para o ComfyUI para edição precisa baseada em instruções que preserva a estrutura e identidade das suas imagens-fonte. Suporta tanto a edição de imagem única quanto o uso de referência multi-imagem, permitindo transferência de estilo, substituição de material ou objeto, mudanças de atributos e aprimoramento visual limpo com resultados naturais e coerentes.

Construído em um codificador de visão-linguagem mais um transformador de difusão, o gráfico converte instruções em inglês simples em edição de imagem consistente. Um Lightning LoRA opcional torna as gerações do Qwen Image Edit 2511 rápidas sem sacrificar o alinhamento, para que artistas e equipes de produto possam iterar rapidamente na edição criativa de imagens, reestilização de personagens e refinamento de conteúdo profissional.

Quer uma experiência mais simples, sem nós? Experimente a versão Playground para explorar Qwen Image Edit 2511 Playground sem usar nós do ComfyUI—basta fazer upload de uma imagem e editar com instruções de texto.

Modelos chave no fluxo de trabalho ComfyUI Qwen Image Edit 2511#

Qwen‑Image‑Edit‑2511. O transformador de difusão central para edição com consistência melhorada sobre 2509, projetado para seguir instruções enquanto mantém a identidade e a geometria estáveis. Hugging Face: Qwen/Qwen-Image-Edit-2511
Qwen2.5‑VL‑7B‑Instruct. O codificador de visão-linguagem usado como a espinha dorsal de compreensão texto/imagem; alinha suas instruções com o contexto visual para edição baseada em instruções. Hugging Face: Qwen/Qwen2.5-VL-7B-Instruct
Qwen Image VAE. O autoencoder variacional correspondente que mapeia entre o espaço de pixels e o espaço latente do modelo para reconstrução fiel. (Arquivos fornecidos via pacote Comfy‑Org.) Hugging Face: Comfy-Org/Qwen-Image_ComfyUI
Qwen‑Image‑Edit‑2511‑Lightning (opcional). Um LoRA de aceleração de 4 etapas que acelera significativamente o sampler enquanto mantém as edições no ponto; ative quando quiser pré-visualizações rápidas ou edição de imagem única quase em tempo real. Hugging Face: lightx2v/Qwen-Image-Edit-2511-Lightning

Como usar o fluxo de trabalho ComfyUI Qwen Image Edit 2511#

Este gráfico contém duas trilhas paralelas: “Imagens Múltiplas” para transferência de atributos/materiais entre imagens e “Imagem Única” para edição direta baseada em instruções. Ambas as trilhas compartilham os mesmos carregadores de modelo e lógica de sampler, e ambas terminam com nós de pré-visualização e salvamento. Escolha a trilha que corresponde à sua tarefa, escreva uma instrução clara e coloque na fila.

Imagens Múltiplas › Carregar imagem#

Use este grupo para carregar duas imagens de referência: a primeira é sua base para editar e a segunda fornece o visual, material ou atributos para transferir. As imagens são redimensionadas automaticamente para tamanhos de trabalho equilibrados para preservar o layout e evitar artefatos durante a difusão. Se possível, escolha referências com enquadramento ou ponto de vista semelhantes para melhorar o alinhamento. Este caminho suporta tarefas como “substituir o material da cadeira na imagem da esquerda pelo da imagem da direita” enquanto mantém a forma e a estrutura.

Imagens Múltiplas › Prompt#

Componha uma instrução curta e explícita que descreva o objetivo da edição e como a segunda imagem deve influenciar a primeira. Por exemplo: “Substitua o material da cadeira da Figura 1 pelo couro da Figura 2, mantenha a estrutura inalterada, combine a iluminação.” A instrução é alimentada para um codificador Qwen2.5-VL que fundamenta o texto nos visuais carregados para edição de imagem confiável. Evite objetivos conflitantes; especifique o que deve permanecer inalterado para resultados seguros de identidade.

Imagens Múltiplas › Carregar modelos#

Este grupo carrega o modelo de difusão Qwen Image Edit 2511, o codificador Qwen2.5-VL e o Qwen Image VAE. Você pode opcionalmente habilitar o Lightning LoRA para acelerar a edição enquanto mantém o seguimento de instruções robusto. Deixe as escolhas de modelo como fornecidas pelo modelo a menos que você tenha um motivo para trocar as variantes.

Imagens Múltiplas › KSampler e saída#

O sampler realiza a difusão controlada para realizar a edição solicitada, usando o condicionamento positivo da instrução e um condicionamento negativo zerado para reduzir mudanças não intencionais. O resultado é decodificado pelo VAE e automaticamente concatenado com as referências para uma pré-visualização lado a lado, facilitando a verificação se a edição de imagem única seguiu sua instrução. Salve o composto ou apenas a imagem editada conforme necessário.

Imagem Única › Carregar imagem#

Solte uma imagem fonte para editar. Uma etapa de escalonamento a prepara para o tamanho de trabalho alvo para que a composição permaneça estável e pequenos detalhes permaneçam nítidos. Este é o caminho mais limpo para edição baseada em instruções quando você não precisa de uma imagem doadora de estilo ou material.

Imagem Única › Prompt#

Escreva uma instrução direta que nomeie o assunto e a mudança exata. Bons padrões incluem “manter X, mudar Y,” “melhorar Z,” ou “reestilizar para [estilo] com a mesma composição.” A instrução é fundida com o contexto visual pelo codificador para que o modelo de difusão possa aplicar uma edição precisa de imagem única enquanto preserva a identidade e a geometria.

Imagem Única › Carregar modelos#

Os carregadores de modelo inicializam Qwen Image Edit 2511, Qwen2.5-VL e o VAE. Opcionalmente, ative o Lightning LoRA para pré-visualizações mais rápidas e iteração rápida. Se você desativar o LoRA, o modelo base priorizará a máxima fidelidade e consistência.

Imagem Única › KSampler e saída#

O sampler executa sua edição com condicionamento derivado do codificador e depois decodifica para uma imagem. Use a pré-visualização para avaliar se a edição satisfez a instrução sem se desviar do visual original. Salve a imagem final quando estiver satisfeito.

Nós chave no fluxo de trabalho ComfyUI Qwen Image Edit 2511#

TextEncodeQwenImageEditPlusAdvance_lrzjason (#13, #64)

Função: Empacota sua instrução com uma ou mais imagens de referência no condicionamento que guia o Qwen Image Edit 2511. Para tarefas de multi-imagem, refira-se explicitamente à primeira e segunda imagens na instrução para controlar o que é transferido. Se você ver edição excessiva, torne a instrução mais restrita (por exemplo, “não mude a pose ou iluminação”) e mantenha a descrição ancorada em objetos reais na imagem.

KSampler (#48, #72)

Função: Conduz o processo de difusão que transforma o condicionamento na edição final. Com o Lightning LoRA habilitado, use muito poucos passos com baixa orientação para velocidade; sem ele, aumente os passos para máxima fidelidade. Se os resultados se desviarem, reduza a orientação; se a mudança for muito sutil, adicione um pouco mais de orientação ou passos.

LoraLoaderModelOnly (#49, #68)

Função: Injeta o Qwen‑Image‑Edit‑2511‑Lightning LoRA para aceleração de 4 etapas. Mantenha o peso próximo ao seu padrão para resultados fiéis e desative-o quando quiser comparar com a qualidade do modelo base ou refinar uma edição complicada.

FluxKontextImageScale (#5, #6, #62)

Função: Redimensiona as entradas para tamanhos de trabalho estáveis para que o codificador e o sampler vejam um contexto espacial consistente. Deixe ligado para a maioria dos casos; se você precisar preservar a resolução original exatamente, ajuste aqui primeiro e depois refine com o sampler.

Extras opcionais#

Escreva instruções que nomeiem o assunto e o escopo: “mudar a cor da jaqueta para azul-marinho, manter a textura do tecido e iluminação” resulta em edição de imagem mais confiável do que prompts de estilo vagos.
Para transferência multi-imagem, escolha doadores com ponto de vista e iluminação semelhantes à imagem base; isso melhora a correspondência de material e estilo.
Ao habilitar o Lightning para pré-visualizações rápidas, confirme o final com uma execução padrão se precisar da máxima fidelidade absoluta.
Se uma edição tocar muito da moldura, adicione restrições como “manter o fundo inalterado” ou “preservar características faciais” para apertar o comportamento da edição de imagem única.

Referências

Cartão de modelo Qwen‑Image‑Edit‑2511: Hugging Face
Qwen2.5‑VL‑7B‑Instruct: Hugging Face
Qwen Image VAE e arquivos empacotados para ComfyUI: Hugging Face
Qwen‑Image‑Edit‑2511‑Lightning LoRA: Hugging Face
Relatório técnico Qwen‑Image: arXiv

Agradecimentos#

Este fluxo de trabalho implementa e constrói sobre os seguintes trabalhos e recursos. Agradecemos sinceramente ao Qwen pelo modelo Qwen-Image-Edit-2511 por suas contribuições e manutenção. Para detalhes autoritativos, consulte a documentação original e os repositórios vinculados abaixo.

Recursos#

Qwen/Qwen-Image-Edit-2511
- GitHub: QwenLM/Qwen-Image
- Hugging Face: Qwen/Qwen-Image-Edit-2511
- arXiv: 2508.02324

Nota: O uso dos modelos, conjuntos de dados e código referenciados está sujeito às respectivas licenças e termos fornecidos por seus autores e mantenedores.

Want More ComfyUI Workflows?

Face Detailer | Corrigir Rostos

Use o Face Detailer primeiro para restauração facial, seguido pelo modelo 4x UltraSharp para upscaling superior.

AnimateDiff + ControlNet + AutoMask | Estilo de Quadrinhos

Reestilize vídeos sem esforço, convertendo personagens realistas em anime enquanto mantém os planos de fundo originais intactos.

SUPIR | Upscaler de Imagem/Vídeo Foto-Realista

O SUPIR permite a restauração foto-realista de imagens, funciona com o modelo SDXL e suporta aprimoramento por prompt de texto.

Face Restore + ControlNet + Reactor | Restaurar Fotos Antigas

Reviva fotos desbotadas em memórias vibrantes, preservando cada detalhe para uma recordação preciosa.

MeshGraphormer ControlNet | Corrigir Mãos

O MeshGraphormer ControlNet corrige mãos malformadas em imagens, preservando o restante.

LTX 2.3 ID-LoRA | Gerador de Avatar Falante

Cria avatares falantes realistas com voz e visuais sincronizados.

Fluxo de Trabalho TripoSplat 3D Gaussian Splats | Imagem para 3D

Transforme uma imagem em 3D Gaussian Splats com TripoSplat.

Z Image | Gerador Fotorrealista Ultra-Rápido

Gere visuais ultra-claros rapidamente com detalhes em tempo real incomparáveis.

Suporte

Recursos

Legal

RunComfy

RunComfy é a principal ComfyUI plataforma, oferecendo ComfyUI online ambiente e serviços, juntamente com fluxos de trabalho do ComfyUI apresentando visuais impressionantes. RunComfy também oferece AI Models, permitindo que artistas utilizem as mais recentes ferramentas de AI para criar arte incrível.

Qwen Image Edit 2511 | Fluxo de Trabalho Inteligente de Edição de Imagem