LongCat Image Edit Turbo: Edição de imagem rápida guiada por prompt no ComfyUI#
LongCat Image Edit Turbo é um fluxo de trabalho ComfyUI desenvolvido para edições rápidas, guiadas por prompt, que mantêm seu assunto e composição intactos. Ele combina o modelo LongCat Image Edit Turbo com o condicionamento Qwen2.5-VL e o AE VAE para oferecer restilização de personagens, alterações localizadas em estilo de máscara e ajustes de iluminação cinematográfica em um ciclo rápido e amigável à iteração.
Projetado para criadores e usuários avançados, este gráfico LongCat Image Edit Turbo aceita qualquer imagem de origem, interpreta sua intenção de edição através de um codificador de visão-linguagem e retorna resultados de alta fidelidade que preservam o enquadramento original. Está pronto para RunComfy e otimizado para pré-visualizações rápidas e refinamento controlado.
Modelos principais no fluxo de trabalho Comfyui LongCat Image Edit Turbo#
- LongCat Image Edit Turbo (bf16). O modelo de difusão que impulsiona edições de imagem rápidas, preservando a composição enquanto responde fortemente à orientação de texto. Model file
- Qwen2.5-VL 7B text encoder (FP8 scaled, ComfyUI packaged). Produz um condicionamento rico ao entender tanto seu prompt quanto o contexto visual da imagem de entrada. Encoder file
- AE VAE (ae.safetensors). Reconstrói imagens a partir de latentes com baixa perda, ajudando o LongCat Image Edit Turbo a preservar detalhes finos após a amostragem. VAE file
Como usar o fluxo de trabalho Comfyui LongCat Image Edit Turbo#
O fluxo de trabalho segue um caminho claro da sua imagem e prompt para um resultado decodificado. As etapas são organizadas em torno de alguns componentes decisivos que mantêm as edições rápidas e estáveis.
Carregue e prepare sua imagem de origem#
- Importe sua foto com
LoadImage(#79). O gráfico a encaminha através deFluxKontextImageScale(#64) para padronizar a escala para edições robustas. - A imagem então define a tela de trabalho via
GetImageSize(#72) eEmptyLatentImage(#61), o que ajuda o LongCat Image Edit Turbo a manter a composição e o posicionamento do assunto. - Esta preparação garante que as edições subsequentes ajam como ajustes inteligentes em estilo de máscara em vez de uma re-síntese completa.
Codifique sua intenção de edição com Qwen#
- O fluxo de trabalho carrega o codificador Qwen2.5-VL usando
CLIPLoader(#19). - Descreva a mudança que deseja em
TextEncodeQwenImageEditPlus (Positive)(#53). Use pistas claras de estilo, iluminação ou atributos para o LongCat Image Edit Turbo aplicar. - Use
TextEncodeQwenImageEditPlus (Negative)(#54) para listar elementos a evitar ou proteger, o que ajuda a preservar identidade e evitar alterações indesejadas. - O codificador lê tanto seu texto quanto a imagem de origem, criando um condicionamento consciente da edição que ancora as mudanças à cena original.
Forme a orientação e a mistura de referências#
FluxGuidance(#21) eFluxGuidance(#22) ajustam como as instruções positivas e negativas influenciam o resultado. Maior ênfase promove edições mais ousadas; menor favorece ajustes sutis e seguros para a composição.FluxKontextMultiReferenceLatentMethod(#51) eFluxKontextMultiReferenceLatentMethod(#52) controlam como múltiplas referências são misturadas se você optar por adicioná-las. Por padrão, o subgrafo auxiliar rotulado “DO NOT USE (LEAVE BYPASSED)” permanece inativo; substitua-o por seus próprios carregadores de imagem se quiser referências adicionais de estilo ou atributos.
Execute o sampler#
- O LongCat Image Edit Turbo UNet é carregado por
UNETLoader(#18) e normalizado para orientação estável comCFGNorm(#23). KSampler(#27) realiza as etapas de difusão reais, transformando sua intenção e contexto em um novo latente. Comece com iterações rápidas para pré-visualizações, depois refine seu prompt ou força de orientação conforme necessário para qualidade final.- Mantenha as edições focadas em um único objetivo claro por passagem para os resultados mais previsíveis.
Decodifique e exporte#
- O AE VAE é trazido via
VAELoader(#20) e usado porVAEDecode(#25) para reconstruir a imagem do latente amostrado com alta fidelidade. SaveImage(#9) escreve o resultado no seu diretório de saída com um prefixo claro, facilitando o acompanhamento das variações entre as execuções.
Nós principais no fluxo de trabalho Comfyui LongCat Image Edit Turbo#
TextEncodeQwenImageEditPlus (Positive)(#53). Converte sua mudança desejada em um condicionamento consciente da edição usando Qwen2.5-VL e a imagem de origem. Foque seu prompt no assunto e na mudança que deseja, como vestuário, humor, iluminação ou material, para guiar o LongCat Image Edit Turbo sem desviar a cena.TextEncodeQwenImageEditPlus (Negative)(#54). Protege identidade e composição especificando o que evitar. Use para reduzir artefatos ou evitar restilizações indesejadas enquanto mantém a cena coerente.FluxGuidance(#21). Ajusta quão assertivamente as instruções positivas conduzem a edição. Aumente para restilização mais forte ou iluminação dramática; diminua para preservar mais da aparência original. Equilibre isso com o quão detalhado é seu prompt e quantas referências você fornece.FluxKontextMultiReferenceLatentMethod(#51). Determina como múltiplas referências são misturadas no condicionamento. Escolha um método que corresponda ao seu objetivo, por exemplo, fusão mais forte para transferência de estilo vs influência mais leve para ajustes de atributos.CFGNorm(#23). Normaliza o comportamento de orientação para que as mudanças permaneçam consistentes em diferentes configurações. Ajuda o LongCat Image Edit Turbo a permanecer estável quando você itera prompts ou troca samplers.KSampler(#27). O coração da geração. Use para iterar rapidamente, fixar uma semente para reprodutibilidade e experimentar diferentes samplers uma vez que você goste da direção. Ajuste em conjunto comFluxGuidancepara equilibrar força de edição versus fidelidade ao original.FluxKontextImageScale(#64). Prepara e escala a imagem de entrada para os nós a jusante. Esta etapa é fundamental para manter o enquadramento e as proporções estáveis durante a edição.
Extras opcionais#
- Adicione mais referências. Se você quiser orientação de múltiplas imagens, substitua o subgrafo auxiliar ignorado por seus próprios nós
LoadImagee conecte-os às entradas de referência extra dos nós de codificação Qwen. Isso é útil para transferências de estilo ou guarda-roupa mantendo a pose e o layout. - Dicas para iteração rápida. Comece com prompts concisos, execute uma pré-visualização rápida, depois refine a redação ou a força da orientação. Use sementes para reproduzir um visual favorito e ramificar pequenas variações.
- Mudanças localizadas por redação. Especifique o alvo claramente, como “mude apenas a jaqueta para vermelho” ou “luz de contorno suave no assunto,” para conduzir edições em estilo de máscara sem exigir uma máscara explícita.
- Variante GGUF. Para cenários de CPU ou VRAM muito baixa, você pode trocar para pesos quantizados do LongCat Image Edit Turbo com
UnetLoaderGGUF(#77). Veja o pacote GGUF para quantizações disponíveis. Model variants
Agradecimentos#
Este fluxo de trabalho implementa e se baseia nos seguintes trabalhos e recursos. Agradecemos sinceramente à Comfy-Org pelo LongCat Image Edit Turbo e componentes relacionados, vantagewithai pelos modelos LongCat Image Edit Turbo GGUF, e à comunidade Civitai pelo fluxo de trabalho LongCat Image Edit Turbo por suas contribuições e manutenção. Para detalhes autoritativos, consulte a documentação e os repositórios originais vinculados abaixo.
Recursos#
- Civitai/Civitai workflow source
- Docs / Release Notes: Civitai model page
- Comfy-Org/LongCat Image Edit Turbo bf16 model
- Hugging Face: Comfy-Org/LongCat-Image
- vantagewithai/LongCat Image Edit Turbo GGUF models
- Hugging Face: vantagewithai/LongCat-Image-Edit-Turbo-GGUF
- Comfy-Org/Qwen 2.5 VL text encoder
- Hugging Face: Comfy-Org/Qwen-Image_ComfyUI
- Comfy-Org/AE VAE
- Hugging Face: Comfy-Org/z_image_turbo
Nota: O uso dos modelos, conjuntos de dados e código referenciados está sujeito às respectivas licenças e termos fornecidos por seus autores e mantenedores.









