BAGEL AI | Texto-para-Imagem Avançado & Chat Visual

Este fluxo de trabalho BAGEL AI é baseado no trabalho de neverbiasu, que desenvolveu a integração ComfyUI-BAGEL. Seus esforços trazem capacidades avançadas de geração multimodal, compreensão e raciocínio para o ecossistema ComfyUI.

ComfyUI BAGEL AI Workflow

BAGEL AI | Advanced Text-to-Image & Visual Chat

Want to run this workflow?

Fully operational workflows
No missing nodes or models
No manual setups required
Features stunning visuals

ComfyUI BAGEL AI Examples

bagel-ai-advanced-text-to-image-visual-chat-1229-example_01.webp

bagel-ai-advanced-text-to-image-visual-chat-1229-example_02.webp

bagel-ai-advanced-text-to-image-visual-chat-1229-example_03.webp

bagel-ai-advanced-text-to-image-visual-chat-1229-example_04.webp

bagel-ai-advanced-text-to-image-visual-chat-1229-example_05.webp

bagel-ai-advanced-text-to-image-visual-chat-1229-example_06.webp

bagel-ai-advanced-text-to-image-visual-chat-1229-example_07.webp

BAGEL AI: Modelo de Base Multimodal para ComfyUI#

BAGEL (BAndwidth-efficient Generalist Expert Learner) AI é um poderoso modelo de base multimodal projetado para geração de imagens e compreensão de visão-linguagem. Baseado em uma arquitetura Mixture-of-Transformer-Experts (MoT) com 14B de parâmetros—com 7B ativos na inferência—BAGEL AI oferece desempenho de ponta em geração de texto-para-imagem, edição de imagem e tarefas de compreensão de imagem.

Integrado diretamente ao ComfyUI, BAGEL AI permite que criadores gerem imagens detalhadas a partir de prompts em linguagem natural, editem visuais com instruções textuais e realizem tarefas multimodais como Q&A visual, legendagem e raciocínio passo a passo. BAGEL AI combina a qualidade dos modelos de difusão (como Stable Diffusion 3) com o poder analítico dos principais VLMs (superando modelos como Qwen2.5-VL e InternVL-2.5).

Por Que Usar BAGEL AI?#

O fluxo de trabalho do BAGEL AI oferece:

Geração de Texto-para-Imagem: Crie imagens de alta qualidade a partir de prompts em linguagem natural usando BAGEL AI
Edição de Imagem via Texto: Modifique imagens existentes usando instruções descritivas com BAGEL AI
Compreensão de Imagem: Realize tarefas de legendagem de imagem, Q&A e análise visual no BAGEL AI
Raciocínio Multimodal: Habilite explicações ou análises passo a passo de entradas visuais através do BAGEL AI
Modelo de Base Tudo-em-Um: Use uma única arquitetura baseada em MoT de 14B para tarefas multimodais diversas dentro do BAGEL AI

Com BAGEL AI, artistas, pesquisadores e desenvolvedores podem explorar tanto as capacidades generativas quanto analíticas da IA multimodal usando uma interface ComfyUI unificada e extensível, alimentada pela tecnologia BAGEL AI.

1 - Geração de Texto-para-Imagem com BAGEL AI#

Gere Imagens Usando Prompts em Linguagem Natural#

BAGEL AI permite que você crie imagens de alta qualidade diretamente de entradas de texto. Para começar com BAGEL AI:

Insira um prompt de texto detalhado no nó de entrada Prompt no BAGEL AI.
Opcionalmente, configure parâmetros como semente, proporção de aspecto ou etapas de decodificação dentro do BAGEL AI.
Execute o fluxo de trabalho BAGEL AI para gerar uma nova imagem a partir do modelo BAGEL.

Esta função do BAGEL AI é ideal para arte conceitual, ideação visual, narrativa ou prototipagem rápida usando descrições puramente em linguagem natural.

2 - Compreensão de Imagem e Q&A Visual com BAGEL AI#

Analise e Compreenda Imagens Usando Linguagem#

BAGEL AI inclui recursos avançados de raciocínio e compreensão multimodal, tornando BAGEL AI ideal para legendagem, análise e Q&A de imagens:

Carregue uma imagem para analisar no BAGEL AI.
Digite uma pergunta ou prompt sobre a imagem no BAGEL AI (por exemplo, "O que o homem está segurando?", "Descreva esta cena.").
O sistema BAGEL AI retorna uma resposta visual ou traço de raciocínio com base no conteúdo da imagem.

Este recurso do BAGEL AI é particularmente útil para educação, marcação de conteúdo, fluxos de trabalho de acessibilidade ou agentes de IA que necessitam de fundamentação visual através das capacidades do BAGEL AI.

3 - Edição de Imagem com Instruções Textuais no BAGEL AI#

Modifique Imagens Existentes via Edição Baseada em Prompt#

BAGEL AI também suporta edição de imagem baseada em prompt através de sua interface avançada do BAGEL AI. Veja como usar o BAGEL AI:

Carregue sua imagem original no nó de entrada do BAGEL AI.
Forneça uma instrução de texto descrevendo a modificação desejada no BAGEL AI (por exemplo, "adicionar fundo de pôr do sol", "fazer nevar", etc.).
Execute o grupo de nós para aplicar suas edições desejadas usando o processamento do BAGEL AI.

Isso permite que artistas e designers transformem imagens de forma não destrutiva através de texto simples, sem necessidade de edição manual de fotos, tudo alimentado pela tecnologia BAGEL AI.

Agradecimentos#

O fluxo de trabalho do BAGEL AI para ComfyUI é baseado no modelo de código aberto BAGEL-7B-MoT da ByteDance Seed. A integração com ComfyUI e a configuração do fluxo de trabalho BAGEL AI foram desenvolvidas por neverbiasu, proporcionando acesso contínuo às capacidades de geração, edição e compreensão de imagem dentro de uma única interface unificada do BAGEL AI.

Repositório GitHub: https://github.com/neverbiasu/ComfyUI-BAGEL

Informações do Modelo BAGEL AI#

Nome do Modelo: ComfyUI BAGEL-7B-MoT
Arquitetura: Mixture-of-Transformer-Experts (MoT) otimizada para BAGEL AI
Total de Parâmetros: 14B (7B Ativos) no BAGEL AI
Caminho do ComfyUI: models/bagel/ComfyUI-BAGEL-7B-MoT/
Download Automático: Ativado para BAGEL AI
Download Manual: https://huggingface.co/ByteDance-Seed/BAGEL-7B-MoT

Want More ComfyUI Workflows?

Geração de Música ACE-Step | Criação de Áudio com IA

Gere música de qualidade de estúdio 15× mais rápido com tecnologia de difusão revolucionária.

ICEdit | Edição de Imagens com IA Rápida com Nunchaku

ICEdit+Nunchaku: Uma solução para edição de imagens com IA ultra-rápida e precisa.

Step1X-Edit | Ferramenta de Edição de Imagens AI

Realize 11 operações de edição com linguagem natural no Step1X-Edit.

LBM Relighting | I2I

Reilumine sujeitos usando entradas de iluminação baseadas em imagem com LBM.

SAM 3D ComfyUI | Animação de Objeto e Corpo

Crie movimento 3D realista e animação a partir de imagens estáticas instantaneamente.

Wan2.1 Stand In | Criador de Vídeos com Personagens Consistentes

Mantém personagens consistentes em vídeos a partir de apenas uma imagem de referência.

SkyReels-A2 | Geração de Vídeo Multi-Elemento

Combine múltiplos elementos em vídeos dinâmicos com precisão.

Inferência FLUX.1 Dev LoRA | AI Toolkit ComfyUI

Execute seu FLUX.1 Dev LoRA treinado com o AI Toolkit no ComfyUI com comportamento correspondente ao treinamento usando um único nó personalizado RCFluxDev.

Suporte

Recursos

Legal

RunComfy

RunComfy é a principal ComfyUI plataforma, oferecendo ComfyUI online ambiente e serviços, juntamente com fluxos de trabalho do ComfyUI apresentando visuais impressionantes. RunComfy também oferece AI Models, permitindo que artistas utilizem as mais recentes ferramentas de AI para criar arte incrível.

BAGEL AI | T2I + I2T + I2I