ComfyUI  >  Flujos de trabajo  >  BAGEL AI | T2I + I2T + I2I

BAGEL AI | T2I + I2T + I2I

BAGEL AI es un modelo de fundación multimodal de código abierto con 7B parámetros activos (14B en total) y un diseño de Mixture-of-Transformer-Experts (MoT). Diseñado para tareas multimodales como generación de texto a imagen, edición de imágenes y respuesta a preguntas visuales, BAGEL AI supera a VLMs de primer nivel abiertos como Qwen2.5-VL e InternVL-2.5 en pruebas de referencia. También proporciona capacidades generativas de alta calidad a la par con modelos especializados como SD3. Con soporte para indicaciones en lenguaje natural, razonamiento complejo y transparencia opcional en el proceso de toma de decisiones del modelo, BAGEL AI ofrece una solución todo en uno para flujos de trabajo multimodales avanzados en ComfyUI.

ComfyUI BAGEL AI Flujo de trabajo

BAGEL AI | Advanced Text-to-Image & Visual Chat
¿Quiere ejecutar este flujo de trabajo?
  • Flujos de trabajo completamente operativos
  • Sin nodos ni modelos faltantes
  • No se requiere configuración manual
  • Presenta visuales impresionantes

ComfyUI BAGEL AI Ejemplos

bagel-ai-advanced-text-to-image-visual-chat-1229-example_01.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_02.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_03.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_04.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_05.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_06.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_07.webp

ComfyUI BAGEL AI Descripción

BAGEL AI: Modelo de Fundación Multimodal para ComfyUI

BAGEL (BAndwidth-efficient Generalist Expert Learner) AI es un potente modelo de fundación multimodal diseñado tanto para generación de imágenes como para comprensión de visión-lenguaje. Basado en una arquitectura de Mixture-of-Transformer-Experts (MoT) de 14B parámetros—con 7B activos en inferencia—BAGEL AI ofrece un rendimiento de vanguardia en generación de texto a imagen, edición de imágenes y tareas de comprensión de imágenes.

Integrado directamente en ComfyUI, BAGEL AI permite a los creadores generar imágenes detalladas a partir de indicaciones en lenguaje natural, editar visuales con instrucciones textuales y realizar tareas multimodales como preguntas y respuestas visuales, subtitulado y razonamiento paso a paso. BAGEL AI combina la calidad de los modelos de difusión (como Stable Diffusion 3) con el poder analítico de los VLMs líderes (superando a modelos como Qwen2.5-VL e InternVL-2.5).

¿Por qué usar BAGEL AI?

BAGEL AI

El flujo de trabajo de BAGEL AI ofrece:

  • Generación de Texto a Imagen: Crea imágenes de alta calidad a partir de indicaciones en lenguaje natural usando BAGEL AI
  • Edición de Imágenes a través de Texto: Modifica imágenes existentes usando instrucciones descriptivas con BAGEL AI
  • Comprensión de Imágenes: Realiza subtitulado de imágenes, preguntas y respuestas, y tareas de análisis visual en BAGEL AI
  • Razonamiento Multimodal: Habilita explicaciones o análisis paso a paso de entradas visuales a través de BAGEL AI
  • Modelo de Fundación Todo en Uno: Utiliza una arquitectura única de 14B basada en MoT para diversas tareas multimodales dentro de BAGEL AI

Con BAGEL AI, artistas, investigadores y desarrolladores pueden explorar tanto las capacidades generativas como analíticas de la IA multimodal usando una interfaz unificada y extensible de ComfyUI impulsada por la tecnología BAGEL AI.

1 - Generación de Texto a Imagen con BAGEL AI

BAGEL AI

Genera Imágenes Usando Indicaciones en Lenguaje Natural

BAGEL AI te permite crear imágenes de alta calidad directamente a partir de entradas de texto. Para comenzar con BAGEL AI:

  1. Ingresa una indicación de texto detallada en el nodo de entrada Prompt en BAGEL AI.
  2. Opcionalmente configura parámetros como semilla, relación de aspecto o pasos de decodificación dentro de BAGEL AI.
  3. Ejecuta el flujo de trabajo de BAGEL AI para generar una nueva imagen desde el modelo BAGEL.

Esta función de BAGEL AI es ideal para arte conceptual, ideación visual, narración de historias o prototipado rápido usando descripciones puramente en lenguaje natural.

2 - Comprensión de Imágenes y Q&A Visual con BAGEL AI

BAGEL AI

Analiza y Comprende Imágenes Usando Lenguaje

BAGEL AI incluye características avanzadas de razonamiento y comprensión multimodal, haciendo de BAGEL AI ideal para subtitulado de imágenes, análisis y preguntas y respuestas:

  1. Sube una imagen para analizar en BAGEL AI.
  2. Escribe una pregunta o indicación sobre la imagen en BAGEL AI (por ejemplo, "¿Qué sostiene el hombre?", "Describe esta escena.").
  3. El sistema BAGEL AI devuelve una respuesta visual o un rastro de razonamiento basado en el contenido de la imagen.
    Esta característica de BAGEL AI es particularmente útil para educación, etiquetado de contenido, flujos de trabajo de accesibilidad o agentes de IA que necesitan base visual a través de las capacidades de BAGEL AI.

3 - Edición de Imágenes con Instrucciones Textuales en BAGEL AI

BAGEL AI

Modifica Imágenes Existentes mediante Edición Basada en Indicaciones

BAGEL AI también soporta la edición de imágenes basada en indicaciones a través de su avanzada interfaz BAGEL AI. Así es como se usa BAGEL AI:

  1. Sube tu imagen original en el nodo de entrada de BAGEL AI.
  2. Proporciona una instrucción textual describiendo la modificación que deseas en BAGEL AI (por ejemplo, "añadir un fondo de atardecer", "hacer que nieve", etc.).
  3. Ejecuta el grupo de nodos para aplicar las ediciones deseadas usando el procesamiento de BAGEL AI.

Esto permite a artistas y diseñadores transformar imágenes de manera no destructiva mediante texto simple sin necesidad de edición manual de fotos, todo impulsado por la tecnología BAGEL AI.

Reconocimiento

El flujo de trabajo de BAGEL AI para ComfyUI está basado en el modelo de código abierto BAGEL-7B-MoT de ByteDance Seed.
La integración de ComfyUI y la configuración del flujo de trabajo BAGEL AI fueron desarrolladas por neverbiasu, proporcionando acceso sin problemas a capacidades de generación de imágenes, edición y comprensión dentro de una interfaz BAGEL AI unificada.

Repositorio en GitHub:

Información del Modelo BAGEL AI

  • Nombre del Modelo: ComfyUI BAGEL-7B-MoT
  • Arquitectura: Mixture-of-Transformer-Experts (MoT) optimizada para BAGEL AI
  • Parámetros Totales: 14B (7B Activos) en BAGEL AI
  • Ruta de ComfyUI: models/bagel/ComfyUI-BAGEL-7B-MoT/
  • Descarga Automática: Habilitada para BAGEL AI
  • Descarga Manual:

¿Quiere más flujos de trabajo de ComfyUI?

RunComfy
Derechos de autor 2025 RunComfy. Todos los derechos reservados.

RunComfy es la principal ComfyUI plataforma, ofreciendo ComfyUI en línea entorno y servicios, junto con flujos de trabajo de ComfyUI con impresionantes imágenes. RunComfy también ofrece AI Playground, permitiendo a los artistas aprovechar las últimas herramientas de AI para crear arte increíble.