Edição e Composição de Imagens Múltiplas Nunchaku Qwen para ComfyUI
Nunchaku Qwen Image é um fluxo de trabalho de edição e composição de imagens múltiplas guiado por prompt para ComfyUI. Aceita até três imagens de referência, permite especificar como devem ser mescladas ou transformadas, e produz um resultado coeso guiado por linguagem natural. Os casos de uso típicos incluem mesclar sujeitos, substituir fundos ou transferir estilos e detalhes de uma imagem para outra.
Construído em torno da família de imagens Qwen, este fluxo de trabalho dá a artistas, designers e criadores controle preciso enquanto permanece rápido e previsível. Inclui também uma rota de edição de imagem única e uma rota de texto para imagem, para que você possa gerar, refinar e compor dentro de um único pipeline de Imagem Nunchaku Qwen.
Nota: Selecione tipos de máquina dentro da faixa de Médio a 2XLarge. O uso de tipos de máquina 2XLarge Plus ou 3XLarge não é suportado e resultará em falha na execução.
Modelos principais no fluxo de trabalho Comfyui Nunchaku Qwen Image
- Nunchaku Qwen Image Edit 2509. Pesos de difusão/DiT otimizados para edição de imagem guiada por prompt e transferência de atributos. Forte em edições localizadas, trocas de objetos e mudanças de fundo. Model card
- Nunchaku Qwen Image (base). Gerador base usado pela ramificação de texto para imagem para síntese criativa sem uma foto de origem. Model card
- Qwen2.5‑VL 7B codificador de texto. Modelo de linguagem multimodal que interpreta prompts e os alinha com características visuais para edição e geração. Model page
- Qwen Image VAE. Autoencoder variacional usado para codificar imagens de origem em latentes e decodificar resultados finais com cores e detalhes fiéis. Assets
Como usar o fluxo de trabalho Comfyui Nunchaku Qwen Image
Este gráfico contém três rotas independentes que compartilham a mesma linguagem visual e lógica de amostragem. Use uma ramificação por vez, dependendo se você está editando várias imagens, refinando uma única imagem ou gerando a partir de texto.
Nunchaku‑qwen‑image‑edit‑2509 (edição e composição de imagens múltiplas)
Esta ramificação carrega o modelo de edição com NunchakuQwenImageDiTLoader (#115), o direciona através de ModelSamplingAuraFlow (#66) e CFGNorm (#75), e então sintetiza com KSampler (#3). Carregue até três imagens usando LoadImage (#78, #106, #108). A referência principal é codificada por VAEEncode (#88) para definir a tela, e ImageScaleToTotalPixels (#93) mantém as entradas dentro de uma faixa de tamanho estável.
Escreva sua instrução em TextEncodeQwenImageEditPlus (#111) e, se necessário, coloque remoções ou restrições no TextEncodeQwenImageEditPlus (#110) pareado. Refira-se às fontes explicitamente, por exemplo: “Cachorro na imagem 1 usa o chapéu verde da imagem 2 e os óculos da imagem 3.” Para tamanho de saída personalizado, você pode substituir o latente codificado por EmptySD3LatentImage (#112). Os resultados são decodificados por VAEDecode (#8) e salvos com SaveImage (#60).
Nunchaku‑qwen‑image‑edit (refinamento de imagem única)
Escolha isto quando desejar limpezas direcionadas, mudanças de fundo ou ajustes de estilo em uma imagem. O modelo é carregado por NunchakuQwenImageDiTLoader (#120), adaptado por ModelSamplingAuraFlow (#125) e CFGNorm (#123), e amostrado por KSampler (#127). Importe sua foto com LoadImage (#129); ela é normalizada por ImageScaleToTotalPixels (#130) e codificada por VAEEncode (#131).
Forneça sua instrução em TextEncodeQwenImageEdit (#121) e orientação contrária opcional em TextEncodeQwenImageEdit (#122) para manter ou remover elementos. A ramificação decodifica com VAEDecode (#124) e grava arquivos via SaveImage (#128).
Nunchaku‑qwen‑image (texto para imagem)
Use esta ramificação para criar novas imagens do zero com o modelo base. NunchakuQwenImageDiTLoader (#146) alimenta ModelSamplingAuraFlow (#138). Insira seus prompts positivos e negativos em CLIPTextEncode (#143) e CLIPTextEncode (#137). Defina sua tela com EmptySD3LatentImage (#136), então gere com KSampler (#141), decodifique usando VAEDecode (#142), e salve com SaveImage (#147).
Nós principais no fluxo de trabalho Comfyui Nunchaku Qwen Image
NunchakuQwenImageDiTLoader (#115) Carrega os pesos e a variante de imagem Qwen usados pela ramificação. Selecione o modelo de edição para edições guiadas por foto ou o modelo base para texto para imagem. Quando o VRAM permite, variantes de maior precisão ou resolução podem oferecer mais detalhes; variantes mais leves priorizam velocidade.
TextEncodeQwenImageEditPlus (#111) Conduz edições de múltiplas imagens ao analisar sua instrução e vinculá-la a até três referências. Mantenha diretivas explícitas sobre qual imagem contribui com qual atributo. Use frases concisas e evite objetivos conflitantes para manter as edições focadas.
TextEncodeQwenImageEditPlus (#110) Atua como o codificador negativo ou de restrição pareado para a ramificação de múltiplas imagens. Use-o para excluir objetos, estilos ou artefatos que você não deseja que apareçam. Isso geralmente ajuda a preservar a composição enquanto remove sobreposições de interface ou adereços indesejados.
TextEncodeQwenImageEdit (#121) Instrução positiva para a ramificação de edição de imagem única. Descreva o resultado desejado, qualidades de superfície e composição em termos claros. Mire em uma a três frases que especifiquem a cena e as mudanças.
TextEncodeQwenImageEdit (#122) Prompt negativo ou de restrição para a ramificação de edição de imagem única. Liste itens ou traços a evitar, ou descreva elementos a serem removidos da imagem de origem. Isso é útil para limpar texto disperso, logotipos ou elementos de interface.
ImageScaleToTotalPixels (#93) Previne que entradas superdimensionadas desestabilizem os resultados ao escalar para uma contagem total de pixels alvo. Use-o para harmonizar resoluções de origem díspares antes da composição. Se notar inconsistências na nitidez entre fontes, aproxime-as em tamanho efetivo aqui.
ModelSamplingAuraFlow (#66) Aplica uma programação de amostragem DiT/fluxo ajustada para os modelos de imagem Qwen. Se as saídas parecerem escuras, confusas ou sem estrutura, aumente o deslocamento da programação para estabilizar o tom global; se parecerem planas, reduza o deslocamento para buscar detalhes extras.
KSampler (#3) O principal amostrador onde você equilibra velocidade, fidelidade e variedade estocástica. Ajuste os passos e a escala de orientação para consistência versus criatividade, escolha um método de amostragem e bloqueie uma semente quando desejar reprodutibilidade exata entre execuções.
CFGNorm (#75) Normaliza a orientação livre de classificador para reduzir a super-saturação ou explosões de contraste em escalas de orientação mais altas. Deixe no caminho conforme fornecido; ajuda a manter cor e exposição estáveis enquanto você itera em prompts.
Extras opcionais
- Para melhores resultados de múltiplas imagens, escolha fontes com perspectiva e iluminação semelhantes; o modelo de edição de Imagem Nunchaku Qwen então foca no conteúdo em vez de corrigir geometria.
- Refira-se às fontes por ordem (“imagem 1”, “imagem 2”, “imagem 3”) e seja explícito sobre quais atributos transferem para onde.
- Quando as saídas tendem a ser escuras ou desfocadas, ajuste o deslocamento de
ModelSamplingAuraFlowpara cima; quando desejar textura extra, tente um deslocamento ligeiramente menor. - Para definir uma resolução específica, substitua o latente codificado por
EmptySD3LatentImagena ramificação que você está usando. - Use prompts negativos para remover texto de interface, marcas d'água ou objetos indesejados antes de investir em estilo detalhado; isso mantém as edições de Imagem Nunchaku Qwen limpas desde o início.
Agradecimentos
Este fluxo de trabalho implementa e constrói sobre os seguintes trabalhos e recursos. Agradecemos a Nunchaku pelo fluxo de trabalho Qwen-Image (ComfyUI-nunchaku) por suas contribuições e manutenção. Para detalhes autoritativos, consulte a documentação e os repositórios originais vinculados abaixo.
Recursos
- Nunchaku/Qwen-Image
- GitHub: nunchaku-tech/ComfyUI-nunchaku
- Hugging Face: nunchaku-tech/nunchaku-qwen-image
- arXiv: SVDQuant: Absorbing Outliers by Low-Rank Components for 4-Bit Diffusion Models
- Docs / Release Notes: Nunchaku Qwen Image Source
Nota: O uso dos modelos, conjuntos de dados e códigos referenciados está sujeito às respectivas licenças e termos fornecidos por seus autores e mantenedores.




