logo
RunComfy
ComfyUIPlaygroundPricing
discord logo
ComfyUI>Fluxos de Trabalho>Hunyuan Image 2.1 | Gerador de Imagens de IA em Alta Resolução

Hunyuan Image 2.1 | Gerador de Imagens de IA em Alta Resolução

Workflow Name: RunComfy/Hunyuan-Image-2-1
Workflow ID: 0000...1291
Este fluxo de trabalho ajuda você a criar visuais 2K ultra-definidos com controle avançado de prompts. Construído para geração de texto para imagem, ele melhora a clareza, o detalhe e a composição enquanto permanece altamente eficiente. Você pode gerar cenas complexas, personagens e criações estilizadas com alta precisão. Prompts multilíngues e uma etapa de refinamento garantem saídas mais nítidas. Seu design permite produzir resultados polidos e de nível profissional sem alto custo computacional. Perfeito para designers que buscam criações rápidas, precisas e visualmente impressionantes.

Gere imagens nativas 2K com Hunyuan Image 2.1 em ComfyUI

Este fluxo de trabalho transforma seus prompts em renderizações nativas 2048×2048 nítidas usando Hunyuan Image 2.1. Ele combina o transformador de difusão da Tencent com codificadores de texto duplos para elevar o alinhamento semântico e a qualidade de renderização de texto, então amostra eficientemente e decodifica através do VAE de alta compressão correspondente. Se você precisa de cenas, personagens e texto claro em imagem prontos para produção em 2K enquanto mantém velocidade e controle, este fluxo de trabalho ComfyUI Hunyuan Image 2.1 foi feito para você.

Criadores, diretores de arte e artistas técnicos podem inserir prompts multilíngues, ajustar alguns controles e obter consistentemente resultados nítidos. O gráfico é fornecido com um prompt negativo sensato, uma tela nativa 2K e um FP8 UNet para manter o VRAM sob controle, demonstrando o que Hunyuan Image 2.1 pode entregar prontamente.

Modelos principais no fluxo de trabalho Comfyui Hunyuan Image 2.1

  • HunyuanImage‑2.1 da Tencent. Modelo base de texto para imagem com um backbone de transformador de difusão, codificadores de texto duplos, um VAE 32×, pós-treinamento RLHF e destilação meanflow para amostragem eficiente. Links: Hugging Face · GitHub
  • Qwen2.5‑VL‑7B‑Instruct. Codificador multimodal de visão e linguagem usado aqui como codificador de texto semântico para melhorar a compreensão de prompts em cenas complexas e idiomas. Link: Hugging Face
  • ByT5 Small. Codificador em nível de byte sem tokenização que fortalece o manuseio de caracteres e glifos para renderização de texto dentro de imagens. Links: Hugging Face · Paper

Como usar o fluxo de trabalho Comfyui Hunyuan Image 2.1

O gráfico segue um caminho claro do prompt aos pixels: codificar texto com dois codificadores, preparar uma tela latente nativa 2K, amostrar com Hunyuan Image 2.1, decodificar através do VAE correspondente e salvar a saída.

Codificação de texto com codificadores duplos

  • O DualCLIPLoader (#33) carrega Qwen2.5‑VL‑7B e ByT5 Small configurados para Hunyuan Image 2.1. Este conjunto duplo permite que o modelo interprete a semântica da cena enquanto permanece robusto a glifos e texto multilíngue.
  • Insira sua descrição principal em CLIPTextEncode (#6). Você pode escrever em inglês ou chinês, misturar dicas de câmera e iluminação e incluir instruções de texto na imagem.
  • Um prompt negativo pronto para uso em CLIPTextEncode (#7) suprime artefatos comuns. Você pode adaptá-lo ao seu estilo ou deixá-lo como está para resultados equilibrados.

Tela latente em 2K nativo

  • EmptyHunyuanImageLatent (#29) inicializa a tela em 2048×2048 com um único lote. Hunyuan Image 2.1 é projetado para geração 2K, portanto, tamanhos 2K nativos são recomendados para melhor qualidade.
  • Ajuste a largura e altura se necessário, mantendo proporções que Hunyuan suporta. Para proporções alternativas, mantenha dimensões amigáveis ao modelo para evitar artefatos.

Amostragem eficiente com Hunyuan Image 2.1

  • UNETLoader (#37) carrega o checkpoint FP8 para reduzir o VRAM enquanto preserva a fidelidade, então alimenta KSampler (#3) para remoção de ruído.
  • Use as condições positivas e negativas dos codificadores para direcionar a composição e clareza. Ajuste a semente para variedade, etapas para qualidade versus velocidade, e orientação para aderência ao prompt.
  • O fluxo de trabalho foca no caminho do modelo base. Hunyuan Image 2.1 também suporta uma etapa de refinamento; você pode adicionar uma mais tarde se quiser um polimento extra.

Decodificar e salvar

  • VAELoader (#34) traz o VAE do Hunyuan Image 2.1, e VAEDecode (#8) reconstrói a imagem final da latente amostrada com o esquema de compressão 32× do modelo.
  • SaveImage (#9) grava a saída no diretório escolhido. Defina um prefixo claro para o nome do arquivo se planeja iterar entre sementes ou prompts.

Nós principais no fluxo de trabalho Comfyui Hunyuan Image 2.1

DualCLIPLoader (#33)

Este nó carrega o par de codificadores de texto que Hunyuan Image 2.1 espera. Mantenha o tipo de modelo definido para Hunyuan, e selecione Qwen2.5‑VL‑7B e ByT5 Small para combinar forte compreensão de cena com manuseio de texto sensível a glifos. Se você iterar no estilo, ajuste o prompt positivo junto com a orientação em vez de trocar codificadores.

CLIPTextEncode (#6 e #7)

Estes nós transformam seus prompts positivos e negativos em condicionamento. Mantenha o prompt positivo conciso no topo, depois adicione dicas de lente, iluminação e estilo. Use o prompt negativo para suprimir artefatos como membros extras ou texto ruidoso; reduza se achar que está excessivamente restritivo para seu conceito.

EmptyHunyuanImageLatent (#29)

Define a resolução e lote de trabalho. O padrão 2048×2048 alinha-se com a capacidade nativa 2K do Hunyuan Image 2.1. Para outras proporções, escolha pares de largura e altura amigáveis ao modelo e considere aumentar ligeiramente as etapas se você se afastar muito do quadrado.

KSampler (#3)

Conduz o processo de remoção de ruído com Hunyuan Image 2.1. Aumente as etapas quando precisar de microdetalhes mais finos, diminua para rascunhos rápidos. Aumente a orientação para uma aderência mais forte ao prompt, mas observe a sobresaturação ou rigidez; diminua para mais variação natural. Troque sementes para explorar composições sem alterar seu prompt.

UNETLoader (#37)

Carrega o UNet do Hunyuan Image 2.1. O checkpoint FP8 incluído mantém o uso de memória modesto para saída 2K. Se você tiver VRAM suficiente e quiser o máximo de espaço para configurações agressivas, considere uma variante de maior precisão do mesmo modelo das versões oficiais.

VAELoader (#34) e VAEDecode (#8)

Estes nós devem corresponder ao lançamento do Hunyuan Image 2.1 para decodificar corretamente. O VAE de alta compressão do modelo é fundamental para geração rápida 2K; emparelhar o VAE correto evita mudanças de cor e texturas blocadas. Se você mudar o modelo base, sempre atualize o VAE conforme necessário.

Extras opcionais

  • Prompting
    • Hunyuan Image 2.1 responde bem a prompts estruturados: assunto, ação, ambiente, câmera, iluminação, estilo. Para texto na imagem, cite as palavras exatas que deseja e mantenha-as breves.
  • Velocidade e memória
    • O UNet FP8 já é eficiente. Se precisar espremer ainda mais, desative lotes grandes e prefira menos etapas. Nós opcionais de carregador GGUF estão presentes no gráfico, mas desativados por padrão; usuários avançados podem trocá-los ao experimentar checkpoints quantizados.
  • Proporções
    • Mantenha tamanhos amigáveis a 2K nativo para melhores resultados. Se aventurar em formatos largos ou altos, verifique uma renderização limpa e considere um pequeno aumento de etapas.
  • Refinamento
    • Hunyuan Image 2.1 suporta uma etapa de refinamento. Para experimentá-la, adicione um segundo sampler após a passagem base com um checkpoint de refinamento e um leve remoção de ruído para preservar a estrutura enquanto aumenta o microdetalhe.
  • Referências
    • Detalhes do modelo Hunyuan Image 2.1 e downloads: Hugging Face · GitHub
    • Qwen2.5‑VL‑7B‑Instruct: Hugging Face
    • ByT5 Small e paper: Hugging Face · Paper

Agradecimentos

Este fluxo de trabalho implementa e constrói sobre os seguintes trabalhos e recursos. Agradecemos sinceramente @Ai Verse e Hunyuan por Hunyuan Image 2.1 Demo por suas contribuições e manutenção. Para detalhes autoritativos, consulte a documentação original e os repositórios vinculados abaixo.

Recursos

  • Hunyuan/Hunyuan Image 2.1 Demo
    • Docs / Notas de Lançamento: Tutorial do Hunyuan Image 2.1 Demo de @Ai Verse

Nota: O uso dos modelos, conjuntos de dados e código referenciados está sujeito às respectivas licenças e termos fornecidos por seus autores e mantenedores.

Want More ComfyUI Workflows?

Flux Consistent Characters | Input Image

Flux Consistent Characters | Input Image

Crie personagens consistentes e garanta que eles pareçam uniformes usando suas imagens.

Criador de Personagem Consistente

Crie designs de personagens consistentes e de alta resolução a partir de múltiplos ângulos com controle total sobre emoções, iluminação e ambientes.

Flux Depth e Canny

Flux Tools Oficial - Flux Depth e Canny ControlNet Model

Flux UltraRealistic LoRA V2

Flux UltraRealistic LoRA V2

Crie imagens incrivelmente realistas com Flux UltraRealistic LoRA V2

PuLID Flux II | Geração Consistente de Personagens

Gere imagens com controle preciso de personagens enquanto preserva o estilo artístico.

Mochi 1 | Genmo Texto para Vídeo

Demonstração de Texto para Vídeo Usando o Modelo Genmo Mochi 1

LBM Relighting | I2I

Reilumine sujeitos usando entradas de iluminação baseadas em imagem com LBM.

HiDream-I1 | T2I

Geração de imagens de alta qualidade usando um modelo de 17B parâmetros.

Siga-nos
  • LinkedIn
  • Facebook
  • Instagram
  • Twitter
Suporte
  • Discord
  • E-mail
  • Status do Sistema
  • afiliado
Recursos
  • ComfyUI Online Gratuito
  • Guias do ComfyUI
  • RunComfy API
  • Tutoriais do ComfyUI
  • Nós do ComfyUI
  • Saiba Mais
Legal
  • Termos de Serviço
  • Política de Privacidade
  • Política de Cookies
RunComfy
Copyright 2025 RunComfy. Todos os Direitos Reservados.

RunComfy é a principal ComfyUI plataforma, oferecendo ComfyUI online ambiente e serviços, juntamente com fluxos de trabalho do ComfyUI apresentando visuais impressionantes. RunComfy também oferece AI Playground, permitindo que artistas utilizem as mais recentes ferramentas de AI para criar arte incrível.