BAGEL (BAndwidth-efficient Generalist Expert Learner) AI é um poderoso modelo de base multimodal projetado para geração de imagens e compreensão de visão-linguagem. Baseado em uma arquitetura Mixture-of-Transformer-Experts (MoT) com 14B de parâmetros—com 7B ativos na inferência—BAGEL AI oferece desempenho de ponta em geração de texto-para-imagem, edição de imagem e tarefas de compreensão de imagem.
Integrado diretamente ao ComfyUI, BAGEL AI permite que criadores gerem imagens detalhadas a partir de prompts em linguagem natural, editem visuais com instruções textuais e realizem tarefas multimodais como Q&A visual, legendagem e raciocínio passo a passo. BAGEL AI combina a qualidade dos modelos de difusão (como Stable Diffusion 3) com o poder analítico dos principais VLMs (superando modelos como Qwen2.5-VL e InternVL-2.5).
O fluxo de trabalho do BAGEL AI oferece:
Com BAGEL AI, artistas, pesquisadores e desenvolvedores podem explorar tanto as capacidades generativas quanto analíticas da IA multimodal usando uma interface ComfyUI unificada e extensível, alimentada pela tecnologia BAGEL AI.
BAGEL AI permite que você crie imagens de alta qualidade diretamente de entradas de texto. Para começar com BAGEL AI:
Prompt
no BAGEL AI.Esta função do BAGEL AI é ideal para arte conceitual, ideação visual, narrativa ou prototipagem rápida usando descrições puramente em linguagem natural.
BAGEL AI inclui recursos avançados de raciocínio e compreensão multimodal, tornando BAGEL AI ideal para legendagem, análise e Q&A de imagens:
BAGEL AI também suporta edição de imagem baseada em prompt através de sua interface avançada do BAGEL AI. Veja como usar o BAGEL AI:
Isso permite que artistas e designers transformem imagens de forma não destrutiva através de texto simples, sem necessidade de edição manual de fotos, tudo alimentado pela tecnologia BAGEL AI.
O fluxo de trabalho do BAGEL AI para ComfyUI é baseado no modelo de código aberto BAGEL-7B-MoT da ByteDance Seed.
A integração com ComfyUI e a configuração do fluxo de trabalho BAGEL AI foram desenvolvidas por neverbiasu, proporcionando acesso contínuo às capacidades de geração, edição e compreensão de imagem dentro de uma única interface unificada do BAGEL AI.
Repositório GitHub: https://github.com/neverbiasu/ComfyUI-BAGEL
models/bagel/ComfyUI-BAGEL-7B-MoT/
RunComfy é a principal ComfyUI plataforma, oferecendo ComfyUI online ambiente e serviços, juntamente com fluxos de trabalho do ComfyUI apresentando visuais impressionantes. RunComfy também oferece AI Playground, permitindo que artistas utilizem as mais recentes ferramentas de AI para criar arte incrível.