Nunchaku Qwen Image é um fluxo de trabalho de edição e composição de imagens múltiplas guiado por prompt para ComfyUI. Aceita até três imagens de referência, permite especificar como devem ser mescladas ou transformadas, e produz um resultado coeso guiado por linguagem natural. Os casos de uso típicos incluem mesclar sujeitos, substituir fundos ou transferir estilos e detalhes de uma imagem para outra.
Construído em torno da família de imagens Qwen, este fluxo de trabalho dá a artistas, designers e criadores controle preciso enquanto permanece rápido e previsível. Inclui também uma rota de edição de imagem única e uma rota de texto para imagem, para que você possa gerar, refinar e compor dentro de um único pipeline de Imagem Nunchaku Qwen.
Nota: Selecione tipos de máquina dentro da faixa de Médio a 2XLarge. O uso de tipos de máquina 2XLarge Plus ou 3XLarge não é suportado e resultará em falha na execução.
Nunchaku Qwen Image Edit 2509. Pesos de difusão/DiT otimizados para edição de imagem guiada por prompt e transferência de atributos. Forte em edições localizadas, trocas de objetos e mudanças de fundo. Model card
Nunchaku Qwen Image (base). Gerador base usado pela ramificação de texto para imagem para síntese criativa sem uma foto de origem. Model card
Qwen2.5‑VL 7B codificador de texto. Modelo de linguagem multimodal que interpreta prompts e os alinha com características visuais para edição e geração. Model page
Qwen Image VAE. Autoencoder variacional usado para codificar imagens de origem em latentes e decodificar resultados finais com cores e detalhes fiéis. Assets
Este gráfico contém três rotas independentes que compartilham a mesma linguagem visual e lógica de amostragem. Use uma ramificação por vez, dependendo se você está editando várias imagens, refinando uma única imagem ou gerando a partir de texto.
Esta ramificação carrega o modelo de edição com NunchakuQwenImageDiTLoader
(#115), o direciona através de ModelSamplingAuraFlow
(#66) e CFGNorm
(#75), e então sintetiza com KSampler
(#3). Carregue até três imagens usando LoadImage
(#78, #106, #108). A referência principal é codificada por VAEEncode
(#88) para definir a tela, e ImageScaleToTotalPixels
(#93) mantém as entradas dentro de uma faixa de tamanho estável.
Escreva sua instrução em TextEncodeQwenImageEditPlus
(#111) e, se necessário, coloque remoções ou restrições no TextEncodeQwenImageEditPlus
(#110) pareado. Refira-se às fontes explicitamente, por exemplo: “Cachorro na imagem 1 usa o chapéu verde da imagem 2 e os óculos da imagem 3.” Para tamanho de saída personalizado, você pode substituir o latente codificado por EmptySD3LatentImage
(#112). Os resultados são decodificados por VAEDecode
(#8) e salvos com SaveImage
(#60).
Escolha isto quando desejar limpezas direcionadas, mudanças de fundo ou ajustes de estilo em uma imagem. O modelo é carregado por NunchakuQwenImageDiTLoader
(#120), adaptado por ModelSamplingAuraFlow
(#125) e CFGNorm
(#123), e amostrado por KSampler
(#127). Importe sua foto com LoadImage
(#129); ela é normalizada por ImageScaleToTotalPixels
(#130) e codificada por VAEEncode
(#131).
Forneça sua instrução em TextEncodeQwenImageEdit
(#121) e orientação contrária opcional em TextEncodeQwenImageEdit
(#122) para manter ou remover elementos. A ramificação decodifica com VAEDecode
(#124) e grava arquivos via SaveImage
(#128).
Use esta ramificação para criar novas imagens do zero com o modelo base. NunchakuQwenImageDiTLoader
(#146) alimenta ModelSamplingAuraFlow
(#138). Insira seus prompts positivos e negativos em CLIPTextEncode
(#143) e CLIPTextEncode
(#137). Defina sua tela com EmptySD3LatentImage
(#136), então gere com KSampler
(#141), decodifique usando VAEDecode
(#142), e salve com SaveImage
(#147).
NunchakuQwenImageDiTLoader
(#115)
Carrega os pesos e a variante de imagem Qwen usados pela ramificação. Selecione o modelo de edição para edições guiadas por foto ou o modelo base para texto para imagem. Quando o VRAM permite, variantes de maior precisão ou resolução podem oferecer mais detalhes; variantes mais leves priorizam velocidade.
TextEncodeQwenImageEditPlus
(#111)
Conduz edições de múltiplas imagens ao analisar sua instrução e vinculá-la a até três referências. Mantenha diretivas explícitas sobre qual imagem contribui com qual atributo. Use frases concisas e evite objetivos conflitantes para manter as edições focadas.
TextEncodeQwenImageEditPlus
(#110)
Atua como o codificador negativo ou de restrição pareado para a ramificação de múltiplas imagens. Use-o para excluir objetos, estilos ou artefatos que você não deseja que apareçam. Isso geralmente ajuda a preservar a composição enquanto remove sobreposições de interface ou adereços indesejados.
TextEncodeQwenImageEdit
(#121)
Instrução positiva para a ramificação de edição de imagem única. Descreva o resultado desejado, qualidades de superfície e composição em termos claros. Mire em uma a três frases que especifiquem a cena e as mudanças.
TextEncodeQwenImageEdit
(#122)
Prompt negativo ou de restrição para a ramificação de edição de imagem única. Liste itens ou traços a evitar, ou descreva elementos a serem removidos da imagem de origem. Isso é útil para limpar texto disperso, logotipos ou elementos de interface.
ImageScaleToTotalPixels
(#93)
Previne que entradas superdimensionadas desestabilizem os resultados ao escalar para uma contagem total de pixels alvo. Use-o para harmonizar resoluções de origem díspares antes da composição. Se notar inconsistências na nitidez entre fontes, aproxime-as em tamanho efetivo aqui.
ModelSamplingAuraFlow
(#66)
Aplica uma programação de amostragem DiT/fluxo ajustada para os modelos de imagem Qwen. Se as saídas parecerem escuras, confusas ou sem estrutura, aumente o deslocamento da programação para estabilizar o tom global; se parecerem planas, reduza o deslocamento para buscar detalhes extras.
KSampler
(#3)
O principal amostrador onde você equilibra velocidade, fidelidade e variedade estocástica. Ajuste os passos e a escala de orientação para consistência versus criatividade, escolha um método de amostragem e bloqueie uma semente quando desejar reprodutibilidade exata entre execuções.
CFGNorm
(#75)
Normaliza a orientação livre de classificador para reduzir a super-saturação ou explosões de contraste em escalas de orientação mais altas. Deixe no caminho conforme fornecido; ajuda a manter cor e exposição estáveis enquanto você itera em prompts.
ModelSamplingAuraFlow
para cima; quando desejar textura extra, tente um deslocamento ligeiramente menor.EmptySD3LatentImage
na ramificação que você está usando.Este fluxo de trabalho implementa e constrói sobre os seguintes trabalhos e recursos. Agradecemos a Nunchaku pelo fluxo de trabalho Qwen-Image (ComfyUI-nunchaku) por suas contribuições e manutenção. Para detalhes autoritativos, consulte a documentação e os repositórios originais vinculados abaixo.
Nota: O uso dos modelos, conjuntos de dados e códigos referenciados está sujeito às respectivas licenças e termos fornecidos por seus autores e mantenedores.
RunComfy é a principal ComfyUI plataforma, oferecendo ComfyUI online ambiente e serviços, juntamente com fluxos de trabalho do ComfyUI apresentando visuais impressionantes. RunComfy também oferece AI Playground, permitindo que artistas utilizem as mais recentes ferramentas de AI para criar arte incrível.