BAGEL (BAndwidth-efficient Generalist Expert Learner) AI est un puissant modèle fondamental multimodal conçu à la fois pour la génération d'images et la compréhension vision-langage. Basé sur une architecture Mixture-of-Transformer-Experts (MoT) de 14B paramètres—avec 7B actifs à l'inférence—BAGEL AI offre des performances de pointe dans la génération texte-en-image, l'édition d'images, et les tâches de compréhension d'images.
Intégré directement dans ComfyUI, BAGEL AI permet aux créateurs de générer des images détaillées à partir de sollicitations en langage naturel, d'éditer des visuels avec des instructions textuelles, et d'exécuter des tâches multimodales comme les questions-réponses visuelles, le sous-titrage, et le raisonnement étape par étape. BAGEL AI combine la qualité des modèles de diffusion (comme Stable Diffusion 3) avec la puissance analytique des VLM de pointe (surpassant des modèles comme Qwen2.5-VL et InternVL-2.5).
Le flux de travail BAGEL AI offre :
Avec BAGEL AI, les artistes, chercheurs, et développeurs peuvent explorer à la fois les capacités génératives et analytiques de l'IA multimodale en utilisant une interface ComfyUI unifiée et extensible propulsée par la technologie BAGEL AI.
BAGEL AI vous permet de créer des images de haute qualité directement à partir d'entrées textuelles. Pour commencer avec BAGEL AI :
Prompt
dans BAGEL AI.Cette fonction de BAGEL AI est idéale pour l'art conceptuel, l'idéation visuelle, la narration, ou le prototypage rapide en utilisant uniquement des descriptions en langage naturel.
BAGEL AI inclut des fonctionnalités avancées de raisonnement et de compréhension multimodale, faisant de BAGEL AI un choix idéal pour le sous-titrage d'images, l'analyse, et les questions-réponses :
BAGEL AI prend également en charge l'édition d'images basée sur des sollicitations via son interface avancée BAGEL AI. Voici comment utiliser BAGEL AI :
Cela permet aux artistes et designers de transformer des images de manière non destructive à travers un texte simple sans avoir besoin d'une édition photo manuelle, le tout propulsé par la technologie BAGEL AI.
Le flux de travail BAGEL AI pour ComfyUI est basé sur le modèle open-source BAGEL-7B-MoT par ByteDance Seed.
L'intégration ComfyUI et la configuration du flux de travail BAGEL AI ont été développées par neverbiasu, offrant un accès sans couture à la génération d'images, l'édition, et les capacités de compréhension dans une interface unifiée BAGEL AI.
Répertoire GitHub : https://github.com/neverbiasu/ComfyUI-BAGEL
models/bagel/ComfyUI-BAGEL-7B-MoT/
RunComfy est la première ComfyUI plateforme, offrant des ComfyUI en ligne environnement et services, ainsi que des workflows ComfyUI proposant des visuels époustouflants. RunComfy propose également AI Playground, permettant aux artistes d'utiliser les derniers outils d'IA pour créer des œuvres d'art incroyables.