Este fluxo de trabalho oferece edições de imagem rápidas e controláveis impulsionadas pela família Qwen. Com um único prompt, você pode fazer inpainting, substituir fundos, inserir ou remover objetos e aplicar reiluminação cinematográfica enquanto preserva detalhes locais. A Edição de Imagens Qwen é ideal para artistas e criadores que desejam transformações precisas sem lutar com gráficos de nós complexos.
O gráfico é organizado em etapas simples: carregar modelos, carregar uma imagem, escrever prompts, depois amostrar e salvar. Ele vem com um Lightning LoRA opcional para edições ultra-rápidas em 4 etapas, para que você possa iterar rapidamente e definir o visual desejado.
qwen_image_edit_fp8_e4m3fn.safetensors
em .qwen_2.5_vl_7b_fp8_scaled.safetensors
em .qwen_image_vae.safetensors
em .Qwen-Image-Lightning-4steps-V1.0.safetensors
em .O gráfico carrega o UNet de edição com UNETLoader
(#37), o codificador de texto com CLIPLoader
(#38), e o codec latente com VAELoader
(#39). Se você quiser uma iteração mais rápida, ative o opcional LoraLoaderModelOnly
(#89) para aplicar o Lightning LoRA no modelo base. ModelSamplingAuraFlow
(#66) e CFGNorm
(#75) preparam o amostrador para que o modelo de Edição de Imagens Qwen siga os prompts sem exagerar nos detalhes.
Use LoadImage
(#78) para selecionar a foto que você deseja modificar. A imagem passa por ImageScaleToTotalPixels
(#93) para manter a resolução em uma faixa de qualidade amigável, o que ajuda a Edição de Imagens Qwen a evitar artefatos de entradas muito grandes. VAEEncode
(#88) converte pixels em latentes para edição eficiente enquanto preserva a estrutura.
Escreva sua instrução em TextEncodeQwenImageEdit
(#76) como uma diretiva positiva. Exemplos incluem “substitua o fundo por uma paisagem urbana ao pôr do sol,” “remova a pessoa ao fundo,” ou “luz dourada suave à esquerda.” Use o segundo TextEncodeQwenImageEdit
(#77) como um guia negativo quando precisar evitar mudanças, por exemplo “não altere o rosto do sujeito” ou “mantenha a cor da jaqueta.” Ambos os codificadores veem sua imagem carregada e o VAE para que o condicionamento permaneça alinhado com o conteúdo.
KSampler
(#3) executa a edição usando o modelo corrigido e seu condicionamento. Se o Lightning LoRA estiver ativado, você pode convergir com muito poucas etapas; caso contrário, use mais etapas para máxima fidelidade. O latente editado é decodificado por VAEDecode
(#8) e gravado em disco via SaveImage
(#60).
TextEncodeQwenImageEdit
(#76)Codifica a instrução principal que orienta a edição. Prefira verbos diretos como “substituir,” “inserir,” “remover,” “recolorir,” e “reiluminar.” Se a mudança for local, nomeie a região ou objeto explicitamente. Mantenha os prompts concisos; listas longas de tags de estilo raramente são necessárias.
TextEncodeQwenImageEdit
(#77)Fornece orientação negativa ou protetora. Use para dizer ao modelo o que evitar ou para preservar atributos-chave. Bons padrões: “manter tom de pele,” “não mudar a composição,” “ignorar texto de fundo.”
LoraLoaderModelOnly
(#89)Aplica o Qwen-Image-Lightning LoRA para iteração rápida. Ative quando precisar de resultados quase instantâneos. Reduza substancialmente as etapas do amostrador quando este LoRA estiver ativo para manter edições nítidas.
ImageScaleToTotalPixels
(#93)Reduz entradas superdimensionadas para um orçamento de megapixels alvo para estabilizar a qualidade. Use quando as imagens de origem forem muito grandes ou contiverem compressão pesada; geralmente melhora a suavidade das bordas e reduz halos.
CFGNorm
(#75)Normaliza o comportamento de orientação livre de classificadores para que o modelo siga os prompts sem criar artefatos. Se você vir supersaturação ou “superedição,” reduza levemente a força; se as edições parecerem tímidas, aumente um pouco.
KSampler
(#3)Executa o loop de difusão. Comece com etapas modestas para fp8 e aumente apenas se a edição estiver incompleta. Mantenha a orientação moderada; valores muito altos podem lavar regiões preservadas. Quando o Lightning LoRA estiver ativado, use muito poucas etapas para capturar seu benefício de velocidade.
Este fluxo de trabalho implementa e constrói sobre os seguintes trabalhos e recursos. Agradecemos sinceramente à QwenLM por Qwen-Image-Edit, QwenLM por Qwen-Image, e ComfyOrg por Exemplo de Fluxo de Trabalho Nativo do ComfyUI por suas contribuições e manutenção. Para detalhes autoritativos, consulte a documentação original e os repositórios vinculados abaixo.
Nota: O uso dos modelos, conjuntos de dados e código referenciados está sujeito às respectivas licenças e termos fornecidos por seus autores e mantenedores.
RunComfy é a principal ComfyUI plataforma, oferecendo ComfyUI online ambiente e serviços, juntamente com fluxos de trabalho do ComfyUI apresentando visuais impressionantes. RunComfy também oferece AI Playground, permitindo que artistas utilizem as mais recentes ferramentas de AI para criar arte incrível.