ComfyUI  >  Fluxos de Trabalho  >  OmniGen2 | Texto para Imagem & Edição

OmniGen2 | Texto para Imagem & Edição

Experimente o poder da geração multimodal unificada do OmniGen2 no ComfyUI. Este workflow utiliza um modelo de 7 bilhões de parâmetros com arquitetura Transformer de caminho duplo para oferecer geração de texto para imagem excepcional e edição de imagem guiada por texto. Construído na fundação Qwen 2.5 VL, o OmniGen2 se destaca na compreensão composicional, seguimento de prompts longos e modificações precisas de imagem enquanto mantém a qualidade visual e consistência.

ComfyUI OmniGen2 Fluxo de Trabalho

OmniGen2 ComfyUI Workflow | Unified Text-to-Image Generation
Deseja executar este fluxo de trabalho?
  • Fluxos de trabalho totalmente operacionais
  • Sem nós ou modelos ausentes
  • Nenhuma configuração manual necessária
  • Apresenta visuais impressionantes

ComfyUI OmniGen2 Exemplos

omnigen2-comfyui-workflow-unified-text-to-image-generation-1247-example_01.webp
omnigen2-comfyui-workflow-unified-text-to-image-generation-1247-example_02.webp
omnigen2-comfyui-workflow-unified-text-to-image-generation-1247-example_03.webp
omnigen2-comfyui-workflow-unified-text-to-image-generation-1247-example_04.webp

ComfyUI OmniGen2 Descrição

O que é o Workflow OmniGen2 ComfyUI?

O workflow OmniGen2 ComfyUI traz a geração multimodal unificada ao seu alcance, combinando síntese de texto para imagem e edição de imagem baseada em instruções em um único e poderoso framework. Pense nisso como ter um assistente de IA criativo que não apenas gera imagens deslumbrantes a partir de suas descrições de texto, mas também entende e executa comandos de edição complexos com precisão notável.

Este workflow aproveita um sofisticado modelo de 7 bilhões de parâmetros construído na fundação Qwen 2.5 VL, apresentando uma arquitetura Transformer de caminho duplo única. O que torna este modelo especial é seu design desacoplado - usando caminhos separados para geração de texto e imagem, permitindo que mantenha uma compreensão excepcional da linguagem enquanto oferece saídas visuais de alta fidelidade que permanecem fiéis à sua visão criativa.

Principais Recursos e Benefícios do OmniGen2

Modos de Geração Dupla: O OmniGen2 cria novas imagens a partir de texto ou edita imagens existentes com comandos de linguagem natural através da interface intuitiva.

Arquitetura Avançada: O design de caminho duplo do OmniGen2 separa o processamento de texto e imagem para desempenho ideal.

Compreensão Composicional: O OmniGen2 lida com prompts complexos de múltiplos elementos com precisão excepcional em cada geração.

Edição de Imagem Precisa: Faça alterações direcionadas enquanto preserva perfeitamente o restante da sua imagem usando os algoritmos avançados do OmniGen2.

Reflexão Multimodal: O OmniGen2 se auto-analisa e refina as saídas para resultados aprimorados.

Como Usar o OmniGen2 no ComfyUI

Workflow OmniGen2 Texto para Imagem

Configure as dimensões da sua imagem

  • Use o nó EmptySD3LatentImage para definir o tamanho de saída para o OmniGen2:
    • Ajuste a largura e a altura de acordo com suas necessidades do OmniGen2
    • Mantenha batch_size em 1 para geração de imagem única

Crie seu prompt de texto

  • Nos nós CLIP Text Encode (Prompt) para o OmniGen2:
    • Escreva prompts detalhados e descritivos no primeiro codificador
    • Deixe o segundo codificador vazio ou adicione prompts negativos
    • O OmniGen2 se destaca com descrições compostas complexas

Gere e salve

  • Pressione Run para criar sua imagem OmniGen2
  • O VAE Decode converte latentes na imagem final
  • Save Image salva automaticamente sua criação OmniGen2 na pasta de saída

Workflow de Edição de Imagem OmniGen2

Carregue sua imagem de origem

  • Use o nó Load Image para importar a imagem que deseja editar com o OmniGen2
OmniGen2

Escreva sua instrução de edição

  • No nó CLIP Text Encode (Prompt) para o OmniGen2:
    • Descreva claramente e especificamente as mudanças que você deseja
    • Exemplos: "Transformar a cor do cabelo do personagem em prateado natural", "Adicionar óculos aviador"
    • Comandos de linguagem natural funcionam perfeitamente com o OmniGen2

Configure os parâmetros de edição do OmniGen2

  • Scale Image to Total Pixels:
    • upscale_method: area (mantém a qualidade durante o redimensionamento)
    • megapixels: 2.00 (controla o total de pixels)
      • Isso redimensiona sua imagem para aproximadamente 2 milhões de pixels no total
      • Por exemplo: escalaria uma imagem de 1920x1080 para manter ~2MP
      • Valores mais altos = mais detalhes, mas processamento mais lento
      • Valores mais baixos = geração mais rápida, mas menos detalhes
      • 2.00 é ideal para capacidades de edição
      OmniGen2
  • VAE Encode converte sua imagem redimensionada para o espaço latente

Opcional: Habilite a entrada de segunda imagem

  • Os nós roxos (bypassados) permitem operações de múltiplas imagens:
    • Pressione Ctrl+B para alternar o modo bypass
    • Carregue uma segunda imagem para transferência de estilo ou inserção de objetos
    • Perfeito para tarefas como "combinar elementos da imagem 1 e imagem 2"
    OmniGen2

Gere o resultado editado

  • Execute o workflow OmniGen2 para ver suas edições aplicadas
  • Os resultados mantêm alta fidelidade enquanto seguem as instruções com precisão

Agradecimentos

Este workflow ComfyUI integra o modelo inovador OmniGen2 desenvolvido por pesquisadores da Academia de Inteligência Artificial de Pequim. Reconhecimento especial à equipe por criar este sistema de geração multimodal unificada que expande os limites do que é possível com um modelo de 7 bilhões de parâmetros. A arquitetura representa um avanço significativo no equilíbrio entre eficiência do modelo e qualidade de geração.

Mais Recursos Sobre o OmniGen2

O OmniGen2 é lançado sob licença de código aberto, tornando-o livremente disponível para aplicações de pesquisa e comerciais. Para mais informações sobre o OmniGen2:

  • GitHub Repository - Implementação oficial e detalhes da arquitetura do modelo:
  • Página do Projeto - Visão geral abrangente com demos e insights técnicos:
  • Exemplos ComfyUI - Tutoriais passo a passo e workflows adicionais:

Deseja Mais Fluxos de Trabalho do ComfyUI?

RunComfy
Copyright 2025 RunComfy. Todos os Direitos Reservados.

RunComfy é a principal ComfyUI plataforma, oferecendo ComfyUI online ambiente e serviços, juntamente com fluxos de trabalho do ComfyUI apresentando visuais impressionantes. RunComfy também oferece AI Playground, permitindo que artistas utilizem as mais recentes ferramentas de AI para criar arte incrível.