OmniGen2 ComfyUI Workflow | Geração Unificada de Texto para Imagem

ComfyUI OmniGen2 Fluxo de Trabalho

OmniGen2 ComfyUI Workflow | Unified Text-to-Image Generation

Deseja executar este fluxo de trabalho?

Fluxos de trabalho totalmente operacionais
Sem nós ou modelos ausentes
Nenhuma configuração manual necessária
Apresenta visuais impressionantes

ComfyUI OmniGen2 Exemplos

omnigen2-comfyui-workflow-unified-text-to-image-generation-1247-example_01.webp

omnigen2-comfyui-workflow-unified-text-to-image-generation-1247-example_02.webp

omnigen2-comfyui-workflow-unified-text-to-image-generation-1247-example_03.webp

omnigen2-comfyui-workflow-unified-text-to-image-generation-1247-example_04.webp

O que é o Workflow OmniGen2 ComfyUI?#

O workflow OmniGen2 ComfyUI traz a geração multimodal unificada ao seu alcance, combinando síntese de texto para imagem e edição de imagem baseada em instruções em um único e poderoso framework. Pense nisso como ter um assistente de IA criativo que não apenas gera imagens deslumbrantes a partir de suas descrições de texto, mas também entende e executa comandos de edição complexos com precisão notável.

Este workflow aproveita um sofisticado modelo de 7 bilhões de parâmetros construído na fundação Qwen 2.5 VL, apresentando uma arquitetura Transformer de caminho duplo única. O que torna este modelo especial é seu design desacoplado - usando caminhos separados para geração de texto e imagem, permitindo que mantenha uma compreensão excepcional da linguagem enquanto oferece saídas visuais de alta fidelidade que permanecem fiéis à sua visão criativa.

Principais Recursos e Benefícios do OmniGen2#

Modos de Geração Dupla: O OmniGen2 cria novas imagens a partir de texto ou edita imagens existentes com comandos de linguagem natural através da interface intuitiva.

Arquitetura Avançada: O design de caminho duplo do OmniGen2 separa o processamento de texto e imagem para desempenho ideal.

Compreensão Composicional: O OmniGen2 lida com prompts complexos de múltiplos elementos com precisão excepcional em cada geração.

Edição de Imagem Precisa: Faça alterações direcionadas enquanto preserva perfeitamente o restante da sua imagem usando os algoritmos avançados do OmniGen2.

Reflexão Multimodal: O OmniGen2 se auto-analisa e refina as saídas para resultados aprimorados.

Como Usar o OmniGen2 no ComfyUI#

Workflow OmniGen2 Texto para Imagem#

Configure as dimensões da sua imagem

Use o nó EmptySD3LatentImage para definir o tamanho de saída para o OmniGen2:
- Ajuste a largura e a altura de acordo com suas necessidades do OmniGen2
- Mantenha batch_size em 1 para geração de imagem única

Crie seu prompt de texto

Nos nós CLIP Text Encode (Prompt) para o OmniGen2:
- Escreva prompts detalhados e descritivos no primeiro codificador
- Deixe o segundo codificador vazio ou adicione prompts negativos
- O OmniGen2 se destaca com descrições compostas complexas

Gere e salve

Pressione Run para criar sua imagem OmniGen2
O VAE Decode converte latentes na imagem final
Save Image salva automaticamente sua criação OmniGen2 na pasta de saída

Workflow de Edição de Imagem OmniGen2#

Carregue sua imagem de origem

Use o nó Load Image para importar a imagem que deseja editar com o OmniGen2

Escreva sua instrução de edição

No nó CLIP Text Encode (Prompt) para o OmniGen2:
- Descreva claramente e especificamente as mudanças que você deseja
- Exemplos: "Transformar a cor do cabelo do personagem em prateado natural", "Adicionar óculos aviador"
- Comandos de linguagem natural funcionam perfeitamente com o OmniGen2

Configure os parâmetros de edição do OmniGen2

Nó Scale Image to Total Pixels:
- upscale_method: area (mantém a qualidade durante o redimensionamento)
- megapixels: 2.00 (controla o total de pixels)
  - Isso redimensiona sua imagem para aproximadamente 2 milhões de pixels no total
  - Por exemplo: escalaria uma imagem de 1920x1080 para manter ~2MP
  - Valores mais altos = mais detalhes, mas processamento mais lento
  - Valores mais baixos = geração mais rápida, mas menos detalhes
  - 2.00 é ideal para capacidades de edição <img src="https://cdn.runcomfy.net/workflow_assets/1247/readme01.webp" alt="OmniGen2" width="650"/>
VAE Encode converte sua imagem redimensionada para o espaço latente

Opcional: Habilite a entrada de segunda imagem

Os nós roxos (bypassados) permitem operações de múltiplas imagens:
- Pressione Ctrl+B para alternar o modo bypass
- Carregue uma segunda imagem para transferência de estilo ou inserção de objetos
- Perfeito para tarefas como "combinar elementos da imagem 1 e imagem 2" <img src="https://cdn.runcomfy.net/workflow_assets/1247/readme02.webp" alt="OmniGen2" width="650"/>

Gere o resultado editado

Execute o workflow OmniGen2 para ver suas edições aplicadas
Os resultados mantêm alta fidelidade enquanto seguem as instruções com precisão

Agradecimentos#

Este workflow ComfyUI integra o modelo inovador OmniGen2 desenvolvido por pesquisadores da Academia de Inteligência Artificial de Pequim. Reconhecimento especial à equipe por criar este sistema de geração multimodal unificada que expande os limites do que é possível com um modelo de 7 bilhões de parâmetros. A arquitetura representa um avanço significativo no equilíbrio entre eficiência do modelo e qualidade de geração.

Mais Recursos Sobre o OmniGen2#

O OmniGen2 é lançado sob licença de código aberto, tornando-o livremente disponível para aplicações de pesquisa e comerciais. Para mais informações sobre o OmniGen2:

GitHub Repository - Implementação oficial e detalhes da arquitetura do modelo: VectorSpaceLab/OmniGen2
Página do Projeto - Visão geral abrangente com demos e insights técnicos: Official Page
Exemplos ComfyUI - Tutoriais passo a passo e workflows adicionais: ComfyUI Examples

Want More ComfyUI Workflows?

FLUX Kontext Dev | Edição Inteligente de Imagem

Kontext Dev = Controlável + Todas as Necessidades de Design Gráfico em Uma Ferramenta

DreamO | Framework Unificado de Personalização de Imagem Multi-Tarefa

Realize geração de imagem com identidade, estilo, experimentação e multi-condição a partir de 1–3 referências

BAGEL AI | T2I + I2T + I2I

Compreensão e geração multimodal com IA de código aberto.

Step1X-Edit | Ferramenta de Edição de Imagens AI

Realize 11 operações de edição com linguagem natural no Step1X-Edit.

Cosmos-Predict2 | Text2Image & Video2World

Rápido e real! NVIDIA Cosmos com física verdadeira.

Wan 2.2 FLF2V | Geração de Vídeo Quadro-Inicial-Final

Gere vídeos suaves a partir de um quadro inicial e final usando Wan 2.2 FLF2V.

Qwen-Image Lightning | Aumento de Velocidade em 8 Passos

Reduza o tempo de geração pela metade.

LTX Video | Imagem+Texto para Vídeo

Gera vídeos a partir de prompts de imagem+texto.

Suporte

Recursos

Legal

RunComfy

RunComfy é a principal ComfyUI plataforma, oferecendo ComfyUI online ambiente e serviços, juntamente com fluxos de trabalho do ComfyUI apresentando visuais impressionantes. RunComfy também oferece AI Models, permitindo que artistas utilizem as mais recentes ferramentas de AI para criar arte incrível.

OmniGen2 | Texto para Imagem & Edição