Este fluxo de trabalho transforma seus prompts em renderizações nativas 2048×2048 nítidas usando Hunyuan Image 2.1. Ele combina o transformador de difusão da Tencent com codificadores de texto duplos para elevar o alinhamento semântico e a qualidade de renderização de texto, então amostra eficientemente e decodifica através do VAE de alta compressão correspondente. Se você precisa de cenas, personagens e texto claro em imagem prontos para produção em 2K enquanto mantém velocidade e controle, este fluxo de trabalho ComfyUI Hunyuan Image 2.1 foi feito para você.
Criadores, diretores de arte e artistas técnicos podem inserir prompts multilíngues, ajustar alguns controles e obter consistentemente resultados nítidos. O gráfico é fornecido com um prompt negativo sensato, uma tela nativa 2K e um FP8 UNet para manter o VRAM sob controle, demonstrando o que Hunyuan Image 2.1 pode entregar prontamente.
O gráfico segue um caminho claro do prompt aos pixels: codificar texto com dois codificadores, preparar uma tela latente nativa 2K, amostrar com Hunyuan Image 2.1, decodificar através do VAE correspondente e salvar a saída.
DualCLIPLoader
(#33) carrega Qwen2.5‑VL‑7B e ByT5 Small configurados para Hunyuan Image 2.1. Este conjunto duplo permite que o modelo interprete a semântica da cena enquanto permanece robusto a glifos e texto multilíngue.CLIPTextEncode
(#6). Você pode escrever em inglês ou chinês, misturar dicas de câmera e iluminação e incluir instruções de texto na imagem.CLIPTextEncode
(#7) suprime artefatos comuns. Você pode adaptá-lo ao seu estilo ou deixá-lo como está para resultados equilibrados.EmptyHunyuanImageLatent
(#29) inicializa a tela em 2048×2048 com um único lote. Hunyuan Image 2.1 é projetado para geração 2K, portanto, tamanhos 2K nativos são recomendados para melhor qualidade.UNETLoader
(#37) carrega o checkpoint FP8 para reduzir o VRAM enquanto preserva a fidelidade, então alimenta KSampler
(#3) para remoção de ruído.VAELoader
(#34) traz o VAE do Hunyuan Image 2.1, e VAEDecode
(#8) reconstrói a imagem final da latente amostrada com o esquema de compressão 32× do modelo.SaveImage
(#9) grava a saída no diretório escolhido. Defina um prefixo claro para o nome do arquivo se planeja iterar entre sementes ou prompts.DualCLIPLoader
(#33)Este nó carrega o par de codificadores de texto que Hunyuan Image 2.1 espera. Mantenha o tipo de modelo definido para Hunyuan, e selecione Qwen2.5‑VL‑7B e ByT5 Small para combinar forte compreensão de cena com manuseio de texto sensível a glifos. Se você iterar no estilo, ajuste o prompt positivo junto com a orientação em vez de trocar codificadores.
CLIPTextEncode
(#6 e #7)Estes nós transformam seus prompts positivos e negativos em condicionamento. Mantenha o prompt positivo conciso no topo, depois adicione dicas de lente, iluminação e estilo. Use o prompt negativo para suprimir artefatos como membros extras ou texto ruidoso; reduza se achar que está excessivamente restritivo para seu conceito.
EmptyHunyuanImageLatent
(#29)Define a resolução e lote de trabalho. O padrão 2048×2048 alinha-se com a capacidade nativa 2K do Hunyuan Image 2.1. Para outras proporções, escolha pares de largura e altura amigáveis ao modelo e considere aumentar ligeiramente as etapas se você se afastar muito do quadrado.
KSampler
(#3)Conduz o processo de remoção de ruído com Hunyuan Image 2.1. Aumente as etapas quando precisar de microdetalhes mais finos, diminua para rascunhos rápidos. Aumente a orientação para uma aderência mais forte ao prompt, mas observe a sobresaturação ou rigidez; diminua para mais variação natural. Troque sementes para explorar composições sem alterar seu prompt.
UNETLoader
(#37)Carrega o UNet do Hunyuan Image 2.1. O checkpoint FP8 incluído mantém o uso de memória modesto para saída 2K. Se você tiver VRAM suficiente e quiser o máximo de espaço para configurações agressivas, considere uma variante de maior precisão do mesmo modelo das versões oficiais.
VAELoader
(#34) e VAEDecode
(#8)Estes nós devem corresponder ao lançamento do Hunyuan Image 2.1 para decodificar corretamente. O VAE de alta compressão do modelo é fundamental para geração rápida 2K; emparelhar o VAE correto evita mudanças de cor e texturas blocadas. Se você mudar o modelo base, sempre atualize o VAE conforme necessário.
Este fluxo de trabalho implementa e constrói sobre os seguintes trabalhos e recursos. Agradecemos sinceramente @Ai Verse e Hunyuan por Hunyuan Image 2.1 Demo por suas contribuições e manutenção. Para detalhes autoritativos, consulte a documentação original e os repositórios vinculados abaixo.
Nota: O uso dos modelos, conjuntos de dados e código referenciados está sujeito às respectivas licenças e termos fornecidos por seus autores e mantenedores.
RunComfy é a principal ComfyUI plataforma, oferecendo ComfyUI online ambiente e serviços, juntamente com fluxos de trabalho do ComfyUI apresentando visuais impressionantes. RunComfy também oferece AI Playground, permitindo que artistas utilizem as mais recentes ferramentas de AI para criar arte incrível.