ComfyUI  >  Fluxos de Trabalho  >  BAGEL AI | T2I + I2T + I2I

BAGEL AI | T2I + I2T + I2I

BAGEL AI é um modelo de base multimodal de código aberto com 7B de parâmetros ativos (14B no total) e um design Mixture-of-Transformer-Experts (MoT). Desenvolvido para tarefas multimodais como geração de texto-para-imagem, edição de imagem e resposta a perguntas visuais, BAGEL AI supera VLMs abertos de ponta como Qwen2.5-VL e InternVL-2.5 em testes de benchmark. Ele também oferece capacidades generativas de alta qualidade comparáveis a modelos especializados como SD3. Com suporte para prompts em linguagem natural, raciocínio complexo e transparência opcional no processo de tomada de decisão do modelo, BAGEL AI oferece uma solução completa para fluxos de trabalho multimodais avançados no ComfyUI.

ComfyUI BAGEL AI Fluxo de Trabalho

BAGEL AI | Advanced Text-to-Image & Visual Chat
Deseja executar este fluxo de trabalho?
  • Fluxos de trabalho totalmente operacionais
  • Sem nós ou modelos ausentes
  • Nenhuma configuração manual necessária
  • Apresenta visuais impressionantes

ComfyUI BAGEL AI Exemplos

bagel-ai-advanced-text-to-image-visual-chat-1229-example_01.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_02.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_03.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_04.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_05.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_06.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_07.webp

ComfyUI BAGEL AI Descrição

BAGEL AI: Modelo de Base Multimodal para ComfyUI

BAGEL (BAndwidth-efficient Generalist Expert Learner) AI é um poderoso modelo de base multimodal projetado para geração de imagens e compreensão de visão-linguagem. Baseado em uma arquitetura Mixture-of-Transformer-Experts (MoT) com 14B de parâmetros—com 7B ativos na inferência—BAGEL AI oferece desempenho de ponta em geração de texto-para-imagem, edição de imagem e tarefas de compreensão de imagem.

Integrado diretamente ao ComfyUI, BAGEL AI permite que criadores gerem imagens detalhadas a partir de prompts em linguagem natural, editem visuais com instruções textuais e realizem tarefas multimodais como Q&A visual, legendagem e raciocínio passo a passo. BAGEL AI combina a qualidade dos modelos de difusão (como Stable Diffusion 3) com o poder analítico dos principais VLMs (superando modelos como Qwen2.5-VL e InternVL-2.5).

Por Que Usar BAGEL AI?

BAGEL AI

O fluxo de trabalho do BAGEL AI oferece:

  • Geração de Texto-para-Imagem: Crie imagens de alta qualidade a partir de prompts em linguagem natural usando BAGEL AI
  • Edição de Imagem via Texto: Modifique imagens existentes usando instruções descritivas com BAGEL AI
  • Compreensão de Imagem: Realize tarefas de legendagem de imagem, Q&A e análise visual no BAGEL AI
  • Raciocínio Multimodal: Habilite explicações ou análises passo a passo de entradas visuais através do BAGEL AI
  • Modelo de Base Tudo-em-Um: Use uma única arquitetura baseada em MoT de 14B para tarefas multimodais diversas dentro do BAGEL AI

Com BAGEL AI, artistas, pesquisadores e desenvolvedores podem explorar tanto as capacidades generativas quanto analíticas da IA multimodal usando uma interface ComfyUI unificada e extensível, alimentada pela tecnologia BAGEL AI.

1 - Geração de Texto-para-Imagem com BAGEL AI

BAGEL AI

Gere Imagens Usando Prompts em Linguagem Natural

BAGEL AI permite que você crie imagens de alta qualidade diretamente de entradas de texto. Para começar com BAGEL AI:

  1. Insira um prompt de texto detalhado no nó de entrada Prompt no BAGEL AI.
  2. Opcionalmente, configure parâmetros como semente, proporção de aspecto ou etapas de decodificação dentro do BAGEL AI.
  3. Execute o fluxo de trabalho BAGEL AI para gerar uma nova imagem a partir do modelo BAGEL.

Esta função do BAGEL AI é ideal para arte conceitual, ideação visual, narrativa ou prototipagem rápida usando descrições puramente em linguagem natural.

2 - Compreensão de Imagem e Q&A Visual com BAGEL AI

BAGEL AI

Analise e Compreenda Imagens Usando Linguagem

BAGEL AI inclui recursos avançados de raciocínio e compreensão multimodal, tornando BAGEL AI ideal para legendagem, análise e Q&A de imagens:

  1. Carregue uma imagem para analisar no BAGEL AI.
  2. Digite uma pergunta ou prompt sobre a imagem no BAGEL AI (por exemplo, "O que o homem está segurando?", "Descreva esta cena.").
  3. O sistema BAGEL AI retorna uma resposta visual ou traço de raciocínio com base no conteúdo da imagem.
    Este recurso do BAGEL AI é particularmente útil para educação, marcação de conteúdo, fluxos de trabalho de acessibilidade ou agentes de IA que necessitam de fundamentação visual através das capacidades do BAGEL AI.

3 - Edição de Imagem com Instruções Textuais no BAGEL AI

BAGEL AI

Modifique Imagens Existentes via Edição Baseada em Prompt

BAGEL AI também suporta edição de imagem baseada em prompt através de sua interface avançada do BAGEL AI. Veja como usar o BAGEL AI:

  1. Carregue sua imagem original no nó de entrada do BAGEL AI.
  2. Forneça uma instrução de texto descrevendo a modificação desejada no BAGEL AI (por exemplo, "adicionar fundo de pôr do sol", "fazer nevar", etc.).
  3. Execute o grupo de nós para aplicar suas edições desejadas usando o processamento do BAGEL AI.

Isso permite que artistas e designers transformem imagens de forma não destrutiva através de texto simples, sem necessidade de edição manual de fotos, tudo alimentado pela tecnologia BAGEL AI.

Agradecimentos

O fluxo de trabalho do BAGEL AI para ComfyUI é baseado no modelo de código aberto BAGEL-7B-MoT da ByteDance Seed.
A integração com ComfyUI e a configuração do fluxo de trabalho BAGEL AI foram desenvolvidas por neverbiasu, proporcionando acesso contínuo às capacidades de geração, edição e compreensão de imagem dentro de uma única interface unificada do BAGEL AI.

Repositório GitHub:

Informações do Modelo BAGEL AI

  • Nome do Modelo: ComfyUI BAGEL-7B-MoT
  • Arquitetura: Mixture-of-Transformer-Experts (MoT) otimizada para BAGEL AI
  • Total de Parâmetros: 14B (7B Ativos) no BAGEL AI
  • Caminho do ComfyUI: models/bagel/ComfyUI-BAGEL-7B-MoT/
  • Download Automático: Ativado para BAGEL AI
  • Download Manual:

Deseja Mais Fluxos de Trabalho do ComfyUI?

RunComfy
Copyright 2025 RunComfy. Todos os Direitos Reservados.

RunComfy é a principal ComfyUI plataforma, oferecendo ComfyUI online ambiente e serviços, juntamente com fluxos de trabalho do ComfyUI apresentando visuais impressionantes. RunComfy também oferece AI Playground, permitindo que artistas utilizem as mais recentes ferramentas de AI para criar arte incrível.