O que é o fluxo de trabalho ComfyUI de texto para imagem LongCat Image?
O texto para imagem LongCat Image é um fluxo de trabalho compacto ComfyUI para gerar imagens quadradas 1024x1024 a partir de prompts de texto. Ele usa o modelo de difusão LongCat-Image junto com o codificador de texto Qwen 2.5 VL e o AE VAE, oferecendo uma configuração de prompt para imagem direta para retratos, fotos de produtos e visuais editoriais polidos.
O gráfico é intencionalmente simples: escolha uma resolução quadrada, escreva seu prompt, execute o fluxo de trabalho e salve a imagem. Funciona bem para iteração rápida em prompts em inglês ou chinês, e a nota incluída sugere tentar 50 etapas se quiser comparar o resultado com a configuração do modelo original.
Principais características do texto para imagem LongCat Image
- Geração focada em quadrados: A configuração padrão é ajustada para saída 1:1 em 1024x1024.
- Design de fluxo de trabalho compacto: O gráfico permanece focado na geração de prompt para imagem sem complexidade de roteamento extra.
- Prompting flexível: Adequado para prompts de texto em inglês e chinês.
- Ajuste fácil de qualidade: Comece com a configuração padrão de 20 etapas e aumente as etapas quando quiser uma amostragem mais lenta, mas mais deliberada.
Como usar LongCat Image no ComfyUI
- Escolha o tamanho de saída
- Use o nó
Resolution Selectorpara manter o layout quadrado padrão ou ajustar os megapixels alvo, se necessário.
- Use o nó
- Escreva seu prompt
- Abra o subgrafo
Text to Image (LongCat Image)e substitua o prompt padrão pelo seu próprio assunto, iluminação, humor e instruções de composição.
- Abra o subgrafo
- Execute o fluxo de trabalho
- Enfileire o gráfico para gerar uma única imagem a partir do seu prompt.
- Salve o resultado
- O nó
Save Imagegrava a saída final quando a execução é concluída.
- O nó
Dicas e configurações
- A configuração padrão atual roda em 20 etapas com CFG 4.
- Se você quiser comparar com a recomendação original do fluxo de trabalho fonte, tente 50 etapas.
- Prompts claros e concretos tendem a funcionar melhor do que fragmentos de prompt amplos ou abstratos neste gráfico compacto.
Recursos
- Fonte do fluxo de trabalho: Comfy.org workflow page
- Modelo oficial: meituan-longcat/LongCat-Image on Hugging Face


