OmniGen2 | Texto para Imagem & Edição
Experimente o poder da geração multimodal unificada do OmniGen2 no ComfyUI. Este workflow utiliza um modelo de 7 bilhões de parâmetros com arquitetura Transformer de caminho duplo para oferecer geração de texto para imagem excepcional e edição de imagem guiada por texto. Construído na fundação Qwen 2.5 VL, o OmniGen2 se destaca na compreensão composicional, seguimento de prompts longos e modificações precisas de imagem enquanto mantém a qualidade visual e consistência.ComfyUI OmniGen2 Fluxo de Trabalho

- Fluxos de trabalho totalmente operacionais
- Sem nós ou modelos ausentes
- Nenhuma configuração manual necessária
- Apresenta visuais impressionantes
ComfyUI OmniGen2 Exemplos




ComfyUI OmniGen2 Descrição
O que é o Workflow OmniGen2 ComfyUI?
O workflow OmniGen2 ComfyUI traz a geração multimodal unificada ao seu alcance, combinando síntese de texto para imagem e edição de imagem baseada em instruções em um único e poderoso framework. Pense nisso como ter um assistente de IA criativo que não apenas gera imagens deslumbrantes a partir de suas descrições de texto, mas também entende e executa comandos de edição complexos com precisão notável.
Este workflow aproveita um sofisticado modelo de 7 bilhões de parâmetros construído na fundação Qwen 2.5 VL, apresentando uma arquitetura Transformer de caminho duplo única. O que torna este modelo especial é seu design desacoplado - usando caminhos separados para geração de texto e imagem, permitindo que mantenha uma compreensão excepcional da linguagem enquanto oferece saídas visuais de alta fidelidade que permanecem fiéis à sua visão criativa.
Principais Recursos e Benefícios do OmniGen2
Modos de Geração Dupla: O OmniGen2 cria novas imagens a partir de texto ou edita imagens existentes com comandos de linguagem natural através da interface intuitiva.
Arquitetura Avançada: O design de caminho duplo do OmniGen2 separa o processamento de texto e imagem para desempenho ideal.
Compreensão Composicional: O OmniGen2 lida com prompts complexos de múltiplos elementos com precisão excepcional em cada geração.
Edição de Imagem Precisa: Faça alterações direcionadas enquanto preserva perfeitamente o restante da sua imagem usando os algoritmos avançados do OmniGen2.
Reflexão Multimodal: O OmniGen2 se auto-analisa e refina as saídas para resultados aprimorados.
Como Usar o OmniGen2 no ComfyUI
Workflow OmniGen2 Texto para Imagem
Configure as dimensões da sua imagem
- Use o nó EmptySD3LatentImage para definir o tamanho de saída para o OmniGen2:
- Ajuste a largura e a altura de acordo com suas necessidades do OmniGen2
- Mantenha batch_size em 1 para geração de imagem única
Crie seu prompt de texto
- Nos nós CLIP Text Encode (Prompt) para o OmniGen2:
- Escreva prompts detalhados e descritivos no primeiro codificador
- Deixe o segundo codificador vazio ou adicione prompts negativos
- O OmniGen2 se destaca com descrições compostas complexas
Gere e salve
- Pressione
Run
para criar sua imagem OmniGen2 - O VAE Decode converte latentes na imagem final
- Save Image salva automaticamente sua criação OmniGen2 na pasta de saída
Workflow de Edição de Imagem OmniGen2
Carregue sua imagem de origem
- Use o nó Load Image para importar a imagem que deseja editar com o OmniGen2

Escreva sua instrução de edição
- No nó CLIP Text Encode (Prompt) para o OmniGen2:
- Descreva claramente e especificamente as mudanças que você deseja
- Exemplos: "Transformar a cor do cabelo do personagem em prateado natural", "Adicionar óculos aviador"
- Comandos de linguagem natural funcionam perfeitamente com o OmniGen2
Configure os parâmetros de edição do OmniGen2
- Nó Scale Image to Total Pixels:
- upscale_method: area (mantém a qualidade durante o redimensionamento)
- megapixels: 2.00 (controla o total de pixels)
- Isso redimensiona sua imagem para aproximadamente 2 milhões de pixels no total
- Por exemplo: escalaria uma imagem de 1920x1080 para manter ~2MP
- Valores mais altos = mais detalhes, mas processamento mais lento
- Valores mais baixos = geração mais rápida, mas menos detalhes
- 2.00 é ideal para capacidades de edição
- VAE Encode converte sua imagem redimensionada para o espaço latente
Opcional: Habilite a entrada de segunda imagem
- Os nós roxos (bypassados) permitem operações de múltiplas imagens:
- Pressione Ctrl+B para alternar o modo bypass
- Carregue uma segunda imagem para transferência de estilo ou inserção de objetos
- Perfeito para tarefas como "combinar elementos da imagem 1 e imagem 2"
Gere o resultado editado
- Execute o workflow OmniGen2 para ver suas edições aplicadas
- Os resultados mantêm alta fidelidade enquanto seguem as instruções com precisão
Agradecimentos
Este workflow ComfyUI integra o modelo inovador OmniGen2 desenvolvido por pesquisadores da Academia de Inteligência Artificial de Pequim. Reconhecimento especial à equipe por criar este sistema de geração multimodal unificada que expande os limites do que é possível com um modelo de 7 bilhões de parâmetros. A arquitetura representa um avanço significativo no equilíbrio entre eficiência do modelo e qualidade de geração.
Mais Recursos Sobre o OmniGen2
O OmniGen2 é lançado sob licença de código aberto, tornando-o livremente disponível para aplicações de pesquisa e comerciais. Para mais informações sobre o OmniGen2:
- GitHub Repository - Implementação oficial e detalhes da arquitetura do modelo:
- Página do Projeto - Visão geral abrangente com demos e insights técnicos:
- Exemplos ComfyUI - Tutoriais passo a passo e workflows adicionais:
Deseja Mais Fluxos de Trabalho do ComfyUI?
RunComfy é a principal ComfyUI plataforma, oferecendo ComfyUI online ambiente e serviços, juntamente com fluxos de trabalho do ComfyUI apresentando visuais impressionantes. RunComfy também oferece AI Playground, permitindo que artistas utilizem as mais recentes ferramentas de AI para criar arte incrível.