BAGEL AI | Generación de Texto a Imagen Avanzada y Chat Visual

Este flujo de trabajo de BAGEL AI se basa en el trabajo de neverbiasu, quien desarrolló la integración ComfyUI-BAGEL. Sus esfuerzos traen capacidades avanzadas de generación, comprensión y razonamiento multimodal al ecosistema ComfyUI.

ComfyUI BAGEL AI Workflow

BAGEL AI | Advanced Text-to-Image & Visual Chat

Want to run this workflow?

Fully operational workflows
No missing nodes or models
No manual setups required
Features stunning visuals

ComfyUI BAGEL AI Examples

bagel-ai-advanced-text-to-image-visual-chat-1229-example_01.webp

bagel-ai-advanced-text-to-image-visual-chat-1229-example_02.webp

bagel-ai-advanced-text-to-image-visual-chat-1229-example_03.webp

bagel-ai-advanced-text-to-image-visual-chat-1229-example_04.webp

bagel-ai-advanced-text-to-image-visual-chat-1229-example_05.webp

bagel-ai-advanced-text-to-image-visual-chat-1229-example_06.webp

bagel-ai-advanced-text-to-image-visual-chat-1229-example_07.webp

BAGEL AI: Modelo de Fundación Multimodal para ComfyUI#

BAGEL (BAndwidth-efficient Generalist Expert Learner) AI es un potente modelo de fundación multimodal diseñado tanto para generación de imágenes como para comprensión de visión-lenguaje. Basado en una arquitectura de Mixture-of-Transformer-Experts (MoT) de 14B parámetros—con 7B activos en inferencia—BAGEL AI ofrece un rendimiento de vanguardia en generación de texto a imagen, edición de imágenes y tareas de comprensión de imágenes.

Integrado directamente en ComfyUI, BAGEL AI permite a los creadores generar imágenes detalladas a partir de indicaciones en lenguaje natural, editar visuales con instrucciones textuales y realizar tareas multimodales como preguntas y respuestas visuales, subtitulado y razonamiento paso a paso. BAGEL AI combina la calidad de los modelos de difusión (como Stable Diffusion 3) con el poder analítico de los VLMs líderes (superando a modelos como Qwen2.5-VL e InternVL-2.5).

¿Por qué usar BAGEL AI?#

El flujo de trabajo de BAGEL AI ofrece:

Generación de Texto a Imagen: Crea imágenes de alta calidad a partir de indicaciones en lenguaje natural usando BAGEL AI
Edición de Imágenes a través de Texto: Modifica imágenes existentes usando instrucciones descriptivas con BAGEL AI
Comprensión de Imágenes: Realiza subtitulado de imágenes, preguntas y respuestas, y tareas de análisis visual en BAGEL AI
Razonamiento Multimodal: Habilita explicaciones o análisis paso a paso de entradas visuales a través de BAGEL AI
Modelo de Fundación Todo en Uno: Utiliza una arquitectura única de 14B basada en MoT para diversas tareas multimodales dentro de BAGEL AI

Con BAGEL AI, artistas, investigadores y desarrolladores pueden explorar tanto las capacidades generativas como analíticas de la IA multimodal usando una interfaz unificada y extensible de ComfyUI impulsada por la tecnología BAGEL AI.

1 - Generación de Texto a Imagen con BAGEL AI#

Genera Imágenes Usando Indicaciones en Lenguaje Natural#

BAGEL AI te permite crear imágenes de alta calidad directamente a partir de entradas de texto. Para comenzar con BAGEL AI:

Ingresa una indicación de texto detallada en el nodo de entrada Prompt en BAGEL AI.
Opcionalmente configura parámetros como semilla, relación de aspecto o pasos de decodificación dentro de BAGEL AI.
Ejecuta el flujo de trabajo de BAGEL AI para generar una nueva imagen desde el modelo BAGEL.

Esta función de BAGEL AI es ideal para arte conceptual, ideación visual, narración de historias o prototipado rápido usando descripciones puramente en lenguaje natural.

2 - Comprensión de Imágenes y Q&A Visual con BAGEL AI#

Analiza y Comprende Imágenes Usando Lenguaje#

BAGEL AI incluye características avanzadas de razonamiento y comprensión multimodal, haciendo de BAGEL AI ideal para subtitulado de imágenes, análisis y preguntas y respuestas:

Sube una imagen para analizar en BAGEL AI.
Escribe una pregunta o indicación sobre la imagen en BAGEL AI (por ejemplo, "¿Qué sostiene el hombre?", "Describe esta escena.").
El sistema BAGEL AI devuelve una respuesta visual o un rastro de razonamiento basado en el contenido de la imagen.

Esta característica de BAGEL AI es particularmente útil para educación, etiquetado de contenido, flujos de trabajo de accesibilidad o agentes de IA que necesitan base visual a través de las capacidades de BAGEL AI.

3 - Edición de Imágenes con Instrucciones Textuales en BAGEL AI#

Modifica Imágenes Existentes mediante Edición Basada en Indicaciones#

BAGEL AI también soporta la edición de imágenes basada en indicaciones a través de su avanzada interfaz BAGEL AI. Así es como se usa BAGEL AI:

Sube tu imagen original en el nodo de entrada de BAGEL AI.
Proporciona una instrucción textual describiendo la modificación que deseas en BAGEL AI (por ejemplo, "añadir un fondo de atardecer", "hacer que nieve", etc.).
Ejecuta el grupo de nodos para aplicar las ediciones deseadas usando el procesamiento de BAGEL AI.

Esto permite a artistas y diseñadores transformar imágenes de manera no destructiva mediante texto simple sin necesidad de edición manual de fotos, todo impulsado por la tecnología BAGEL AI.

Reconocimiento#

El flujo de trabajo de BAGEL AI para ComfyUI está basado en el modelo de código abierto BAGEL-7B-MoT de ByteDance Seed. La integración de ComfyUI y la configuración del flujo de trabajo BAGEL AI fueron desarrolladas por neverbiasu, proporcionando acceso sin problemas a capacidades de generación de imágenes, edición y comprensión dentro de una interfaz BAGEL AI unificada.

Repositorio en GitHub: https://github.com/neverbiasu/ComfyUI-BAGEL

Información del Modelo BAGEL AI#

Nombre del Modelo: ComfyUI BAGEL-7B-MoT
Arquitectura: Mixture-of-Transformer-Experts (MoT) optimizada para BAGEL AI
Parámetros Totales: 14B (7B Activos) en BAGEL AI
Ruta de ComfyUI: models/bagel/ComfyUI-BAGEL-7B-MoT/
Descarga Automática: Habilitada para BAGEL AI
Descarga Manual: https://huggingface.co/ByteDance-Seed/BAGEL-7B-MoT

Want More ComfyUI Workflows?

Generación de Música ACE-Step | Creación de Audio AI

Genera música de calidad de estudio 15× más rápido con tecnología de difusión innovadora.

ICEdit | Edición Rápida de Imágenes con IA con Nunchaku

ICEdit+Nunchaku: Una solución para una edición de imágenes con IA ultra-rápida y precisa.

Step1X-Edit | Herramienta de Edición de Imágenes AI

Realiza 11 operaciones de edición con lenguaje natural en Step1X-Edit.

LBM Relighting | I2I

Ilumina sujetos usando entradas de iluminación basadas en imágenes con LBM.

daVinci-MagiHuman | Generador de Humanos Parlantes Realistas

Crea avatares realistas con habla sincronizada y movimiento expresivo.

Wan 2.2 | Líder en Generación de Video de Código Abierto

¡Disponible ahora! Mejor precisión + movimiento más suave.

ComfyUI VNCCS Clone | Generador de Personajes Consistente

Clona personajes rápidamente con resultados estables y de alta calidad listos para sprites.

APISR | Mejorador de imágenes/videos de anime

El modelo APISR mejora y restaura imágenes y videos de anime, haciendo que sus imágenes sean más vibrantes y nítidas.

Soporte

Recursos

Legal

RunComfy

RunComfy es la principal ComfyUI plataforma, ofreciendo ComfyUI en línea entorno y servicios, junto con flujos de trabajo de ComfyUI con impresionantes imágenes. RunComfy también ofrece AI Models, permitiendo a los artistas aprovechar las últimas herramientas de AI para crear arte increíble.

BAGEL AI | T2I + I2T + I2I