BAGEL AI | Texte-en-Image Avancé & Chat Visuel

Ce flux de travail BAGEL AI est basé sur le travail de neverbiasu, qui a développé l'intégration ComfyUI-BAGEL. Leurs efforts apportent des capacités avancées de génération multimodale, de compréhension, et de raisonnement dans l'écosystème ComfyUI.

ComfyUI BAGEL AI Workflow

BAGEL AI | Advanced Text-to-Image & Visual Chat

Want to run this workflow?

Fully operational workflows
No missing nodes or models
No manual setups required
Features stunning visuals

ComfyUI BAGEL AI Examples

bagel-ai-advanced-text-to-image-visual-chat-1229-example_01.webp

bagel-ai-advanced-text-to-image-visual-chat-1229-example_02.webp

bagel-ai-advanced-text-to-image-visual-chat-1229-example_03.webp

bagel-ai-advanced-text-to-image-visual-chat-1229-example_04.webp

bagel-ai-advanced-text-to-image-visual-chat-1229-example_05.webp

bagel-ai-advanced-text-to-image-visual-chat-1229-example_06.webp

bagel-ai-advanced-text-to-image-visual-chat-1229-example_07.webp

BAGEL AI : Modèle Fondamental Multimodal pour ComfyUI#

BAGEL (BAndwidth-efficient Generalist Expert Learner) AI est un puissant modèle fondamental multimodal conçu à la fois pour la génération d'images et la compréhension vision-langage. Basé sur une architecture Mixture-of-Transformer-Experts (MoT) de 14B paramètres—avec 7B actifs à l'inférence—BAGEL AI offre des performances de pointe dans la génération texte-en-image, l'édition d'images, et les tâches de compréhension d'images.

Intégré directement dans ComfyUI, BAGEL AI permet aux créateurs de générer des images détaillées à partir de sollicitations en langage naturel, d'éditer des visuels avec des instructions textuelles, et d'exécuter des tâches multimodales comme les questions-réponses visuelles, le sous-titrage, et le raisonnement étape par étape. BAGEL AI combine la qualité des modèles de diffusion (comme Stable Diffusion 3) avec la puissance analytique des VLM de pointe (surpassant des modèles comme Qwen2.5-VL et InternVL-2.5).

Pourquoi Utiliser BAGEL AI ?#

Le flux de travail BAGEL AI offre :

Génération Texte-en-Image : Créez des images de haute qualité à partir de sollicitations en langage naturel en utilisant BAGEL AI
Édition d'Images via Texte : Modifiez les images existantes en utilisant des instructions descriptives avec BAGEL AI
Compréhension d'Images : Effectuez des sous-titrages d'images, des questions-réponses, et des tâches d'analyse visuelle dans BAGEL AI
Raisonnement Multimodal : Activez une explication ou une analyse étape par étape des entrées visuelles via BAGEL AI
Modèle Fondamental Tout-en-Un : Utilisez une seule architecture MoT de 14B pour des tâches multimodales diversifiées dans BAGEL AI

Avec BAGEL AI, les artistes, chercheurs, et développeurs peuvent explorer à la fois les capacités génératives et analytiques de l'IA multimodale en utilisant une interface ComfyUI unifiée et extensible propulsée par la technologie BAGEL AI.

1 - Génération Texte-en-Image avec BAGEL AI#

Générer des Images à l'Aide de Sollicitations en Langage Naturel#

BAGEL AI vous permet de créer des images de haute qualité directement à partir d'entrées textuelles. Pour commencer avec BAGEL AI :

Entrez une sollicitation textuelle détaillée dans le nœud d'entrée Prompt dans BAGEL AI.
Configurez éventuellement des paramètres comme la graine, le rapport d'aspect, ou les étapes de décodage dans BAGEL AI.
Exécutez le flux de travail BAGEL AI pour générer une nouvelle image à partir du modèle BAGEL.

Cette fonction de BAGEL AI est idéale pour l'art conceptuel, l'idéation visuelle, la narration, ou le prototypage rapide en utilisant uniquement des descriptions en langage naturel.

2 - Compréhension d'Images et Questions-Réponses Visuelles avec BAGEL AI#

Analyser et Comprendre les Images à l'Aide du Langage#

BAGEL AI inclut des fonctionnalités avancées de raisonnement et de compréhension multimodale, faisant de BAGEL AI un choix idéal pour le sous-titrage d'images, l'analyse, et les questions-réponses :

Téléchargez une image à analyser dans BAGEL AI.
Tapez une question ou sollicitation concernant l'image dans BAGEL AI (par exemple, "Que tient l'homme ?", "Décrivez cette scène.").
Le système BAGEL AI retourne une réponse visuelle ou une trace de raisonnement basée sur le contenu de l'image.

Cette fonctionnalité de BAGEL AI est particulièrement utile pour l'éducation, le balisage de contenu, les flux de travail d'accessibilité, ou les agents IA nécessitant un ancrage visuel à travers les capacités de BAGEL AI.

3 - Édition d'Images avec Instructions Textuelles dans BAGEL AI#

Modifier des Images Existantes via l'Édition Basée sur des Sollicitations#

BAGEL AI prend également en charge l'édition d'images basée sur des sollicitations via son interface avancée BAGEL AI. Voici comment utiliser BAGEL AI :

Téléchargez votre image originale dans le nœud d'entrée BAGEL AI.
Fournissez une instruction textuelle décrivant la modification souhaitée dans BAGEL AI (par exemple, "ajouter un fond de coucher de soleil", "faire neiger", etc.).
Exécutez le groupe de nœuds pour appliquer vos modifications souhaitées en utilisant le traitement BAGEL AI.

Cela permet aux artistes et designers de transformer des images de manière non destructive à travers un texte simple sans avoir besoin d'une édition photo manuelle, le tout propulsé par la technologie BAGEL AI.

Remerciements#

Le flux de travail BAGEL AI pour ComfyUI est basé sur le modèle open-source BAGEL-7B-MoT par ByteDance Seed. L'intégration ComfyUI et la configuration du flux de travail BAGEL AI ont été développées par neverbiasu, offrant un accès sans couture à la génération d'images, l'édition, et les capacités de compréhension dans une interface unifiée BAGEL AI.

Répertoire GitHub : https://github.com/neverbiasu/ComfyUI-BAGEL

Informations sur le Modèle BAGEL AI#

Nom du Modèle : ComfyUI BAGEL-7B-MoT
Architecture : Mixture-of-Transformer-Experts (MoT) optimisée pour BAGEL AI
Paramètres Totaux : 14B (7B Actifs) dans BAGEL AI
Chemin ComfyUI : models/bagel/ComfyUI-BAGEL-7B-MoT/
Téléchargement Automatique : Activé pour BAGEL AI
Téléchargement Manuel : https://huggingface.co/ByteDance-Seed/BAGEL-7B-MoT

Want More ComfyUI Workflows?

Génération Musicale ACE-Step | Création Audio IA

Générez de la musique de qualité studio 15× plus rapidement grâce à une technologie de diffusion révolutionnaire.

ICEdit | Édition d'images AI rapide avec Nunchaku

ICEdit+Nunchaku : Une solution pour une édition d'images AI ultra-rapide et précise.

Step1X-Edit | Outil d'Édition d'Images AI

Effectuez 11 opérations d'édition avec le langage naturel dans Step1X-Edit.

LBM Relighting | I2I

Rééclairez les sujets en utilisant des entrées d'éclairage basées sur l'image avec LBM.

Qwen Image 2512 | Générateur d'images AI de précision

Création artistique ultra-détaillée avec une précision visuelle et un contrôle de niveau supérieur.

Blender vers ComfyUI AI Renderer 2.0 | Créateur de Vidéos en Mouvement

Transformez les rendus Blender en animations riches et cinématographiques guidées par l'IA rapidement.

Qwen Image LoRA Inference | AI Toolkit ComfyUI

Maintenez l'inférence Qwen Image LoRA entraînée par l'AI Toolkit dans ComfyUI alignée avec l'aperçu à l'aide d'un seul nœud personnalisé RCQwenImage.

Agrandissement | Étendre l'image

Étendez facilement les images en utilisant le nœud d'agrandissement et le modèle d'inpainting ControlNet.

Support

Ressources

Légal

RunComfy

RunComfy est la première ComfyUI plateforme, offrant des ComfyUI en ligne environnement et services, ainsi que des workflows ComfyUI proposant des visuels époustouflants. RunComfy propose également AI Models, permettant aux artistes d'utiliser les derniers outils d'IA pour créer des œuvres d'art incroyables.

BAGEL AI | T2I + I2T + I2I