BAGEL (BAndwidth-efficient Generalist Expert Learner) AI es un potente modelo de fundación multimodal diseñado tanto para generación de imágenes como para comprensión de visión-lenguaje. Basado en una arquitectura de Mixture-of-Transformer-Experts (MoT) de 14B parámetros—con 7B activos en inferencia—BAGEL AI ofrece un rendimiento de vanguardia en generación de texto a imagen, edición de imágenes y tareas de comprensión de imágenes.
Integrado directamente en ComfyUI, BAGEL AI permite a los creadores generar imágenes detalladas a partir de indicaciones en lenguaje natural, editar visuales con instrucciones textuales y realizar tareas multimodales como preguntas y respuestas visuales, subtitulado y razonamiento paso a paso. BAGEL AI combina la calidad de los modelos de difusión (como Stable Diffusion 3) con el poder analítico de los VLMs líderes (superando a modelos como Qwen2.5-VL e InternVL-2.5).
El flujo de trabajo de BAGEL AI ofrece:
Con BAGEL AI, artistas, investigadores y desarrolladores pueden explorar tanto las capacidades generativas como analíticas de la IA multimodal usando una interfaz unificada y extensible de ComfyUI impulsada por la tecnología BAGEL AI.
BAGEL AI te permite crear imágenes de alta calidad directamente a partir de entradas de texto. Para comenzar con BAGEL AI:
Prompt
en BAGEL AI.Esta función de BAGEL AI es ideal para arte conceptual, ideación visual, narración de historias o prototipado rápido usando descripciones puramente en lenguaje natural.
BAGEL AI incluye características avanzadas de razonamiento y comprensión multimodal, haciendo de BAGEL AI ideal para subtitulado de imágenes, análisis y preguntas y respuestas:
BAGEL AI también soporta la edición de imágenes basada en indicaciones a través de su avanzada interfaz BAGEL AI. Así es como se usa BAGEL AI:
Esto permite a artistas y diseñadores transformar imágenes de manera no destructiva mediante texto simple sin necesidad de edición manual de fotos, todo impulsado por la tecnología BAGEL AI.
El flujo de trabajo de BAGEL AI para ComfyUI está basado en el modelo de código abierto BAGEL-7B-MoT de ByteDance Seed.
La integración de ComfyUI y la configuración del flujo de trabajo BAGEL AI fueron desarrolladas por neverbiasu, proporcionando acceso sin problemas a capacidades de generación de imágenes, edición y comprensión dentro de una interfaz BAGEL AI unificada.
Repositorio en GitHub: https://github.com/neverbiasu/ComfyUI-BAGEL
models/bagel/ComfyUI-BAGEL-7B-MoT/
RunComfy es la principal ComfyUI plataforma, ofreciendo ComfyUI en línea entorno y servicios, junto con flujos de trabajo de ComfyUI con impresionantes imágenes. RunComfy también ofrece AI Playground, permitiendo a los artistas aprovechar las últimas herramientas de AI para crear arte increíble.