BAGEL AI: Modelo de Base Multimodal para ComfyUI#
BAGEL (BAndwidth-efficient Generalist Expert Learner) AI é um poderoso modelo de base multimodal projetado para geração de imagens e compreensão de visão-linguagem. Baseado em uma arquitetura Mixture-of-Transformer-Experts (MoT) com 14B de parâmetros—com 7B ativos na inferência—BAGEL AI oferece desempenho de ponta em geração de texto-para-imagem, edição de imagem e tarefas de compreensão de imagem.
Integrado diretamente ao ComfyUI, BAGEL AI permite que criadores gerem imagens detalhadas a partir de prompts em linguagem natural, editem visuais com instruções textuais e realizem tarefas multimodais como Q&A visual, legendagem e raciocínio passo a passo. BAGEL AI combina a qualidade dos modelos de difusão (como Stable Diffusion 3) com o poder analítico dos principais VLMs (superando modelos como Qwen2.5-VL e InternVL-2.5).
Por Que Usar BAGEL AI?#

O fluxo de trabalho do BAGEL AI oferece:
- Geração de Texto-para-Imagem: Crie imagens de alta qualidade a partir de prompts em linguagem natural usando BAGEL AI
- Edição de Imagem via Texto: Modifique imagens existentes usando instruções descritivas com BAGEL AI
- Compreensão de Imagem: Realize tarefas de legendagem de imagem, Q&A e análise visual no BAGEL AI
- Raciocínio Multimodal: Habilite explicações ou análises passo a passo de entradas visuais através do BAGEL AI
- Modelo de Base Tudo-em-Um: Use uma única arquitetura baseada em MoT de 14B para tarefas multimodais diversas dentro do BAGEL AI
Com BAGEL AI, artistas, pesquisadores e desenvolvedores podem explorar tanto as capacidades generativas quanto analíticas da IA multimodal usando uma interface ComfyUI unificada e extensível, alimentada pela tecnologia BAGEL AI.
1 - Geração de Texto-para-Imagem com BAGEL AI#

Gere Imagens Usando Prompts em Linguagem Natural#
BAGEL AI permite que você crie imagens de alta qualidade diretamente de entradas de texto. Para começar com BAGEL AI:
- Insira um prompt de texto detalhado no nó de entrada
Promptno BAGEL AI. - Opcionalmente, configure parâmetros como semente, proporção de aspecto ou etapas de decodificação dentro do BAGEL AI.
- Execute o fluxo de trabalho BAGEL AI para gerar uma nova imagem a partir do modelo BAGEL.
Esta função do BAGEL AI é ideal para arte conceitual, ideação visual, narrativa ou prototipagem rápida usando descrições puramente em linguagem natural.
2 - Compreensão de Imagem e Q&A Visual com BAGEL AI#

Analise e Compreenda Imagens Usando Linguagem#
BAGEL AI inclui recursos avançados de raciocínio e compreensão multimodal, tornando BAGEL AI ideal para legendagem, análise e Q&A de imagens:
- Carregue uma imagem para analisar no BAGEL AI.
- Digite uma pergunta ou prompt sobre a imagem no BAGEL AI (por exemplo, "O que o homem está segurando?", "Descreva esta cena.").
- O sistema BAGEL AI retorna uma resposta visual ou traço de raciocínio com base no conteúdo da imagem.
Este recurso do BAGEL AI é particularmente útil para educação, marcação de conteúdo, fluxos de trabalho de acessibilidade ou agentes de IA que necessitam de fundamentação visual através das capacidades do BAGEL AI.
3 - Edição de Imagem com Instruções Textuais no BAGEL AI#

Modifique Imagens Existentes via Edição Baseada em Prompt#
BAGEL AI também suporta edição de imagem baseada em prompt através de sua interface avançada do BAGEL AI. Veja como usar o BAGEL AI:
- Carregue sua imagem original no nó de entrada do BAGEL AI.
- Forneça uma instrução de texto descrevendo a modificação desejada no BAGEL AI (por exemplo, "adicionar fundo de pôr do sol", "fazer nevar", etc.).
- Execute o grupo de nós para aplicar suas edições desejadas usando o processamento do BAGEL AI.
Isso permite que artistas e designers transformem imagens de forma não destrutiva através de texto simples, sem necessidade de edição manual de fotos, tudo alimentado pela tecnologia BAGEL AI.
Agradecimentos#
O fluxo de trabalho do BAGEL AI para ComfyUI é baseado no modelo de código aberto BAGEL-7B-MoT da ByteDance Seed. A integração com ComfyUI e a configuração do fluxo de trabalho BAGEL AI foram desenvolvidas por neverbiasu, proporcionando acesso contínuo às capacidades de geração, edição e compreensão de imagem dentro de uma única interface unificada do BAGEL AI.
Repositório GitHub: https://github.com/neverbiasu/ComfyUI-BAGEL
Informações do Modelo BAGEL AI#
- Nome do Modelo: ComfyUI BAGEL-7B-MoT
- Arquitetura: Mixture-of-Transformer-Experts (MoT) otimizada para BAGEL AI
- Total de Parâmetros: 14B (7B Ativos) no BAGEL AI
- Caminho do ComfyUI:
models/bagel/ComfyUI-BAGEL-7B-MoT/ - Download Automático: Ativado para BAGEL AI
- Download Manual: https://huggingface.co/ByteDance-Seed/BAGEL-7B-MoT








