ComfyUI  >  Workflows  >  BAGEL AI | T2I + I2T + I2I

BAGEL AI | T2I + I2T + I2I

BAGEL AI est un modèle fondamental multimodal open-source avec 7B paramètres actifs (14B au total) et un design Mixture-of-Transformer-Experts (MoT). Conçu pour des tâches multimodales comme la génération texte-en-image, l'édition d'images, et les questions-réponses visuelles, BAGEL AI surpasse les VLM ouverts de premier plan tels que Qwen2.5-VL et InternVL-2.5 dans les tests de référence. Il offre également des capacités génératives de haute qualité comparables à des modèles spécialisés comme SD3. Avec le soutien de la sollicitation en langage naturel, du raisonnement complexe et d'une transparence optionnelle dans le processus de décision du modèle, BAGEL AI propose une solution tout-en-un pour des flux de travail multimodaux avancés dans ComfyUI.

Flux de travail ComfyUI BAGEL AI

BAGEL AI | Advanced Text-to-Image & Visual Chat
Vous voulez exécuter ce workflow ?
  • Workflows entièrement opérationnels
  • Aucun nœud ou modèle manquant
  • Aucune configuration manuelle requise
  • Propose des visuels époustouflants

Exemples ComfyUI BAGEL AI

bagel-ai-advanced-text-to-image-visual-chat-1229-example_01.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_02.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_03.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_04.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_05.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_06.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_07.webp

Description ComfyUI BAGEL AI

BAGEL AI : Modèle Fondamental Multimodal pour ComfyUI

BAGEL (BAndwidth-efficient Generalist Expert Learner) AI est un puissant modèle fondamental multimodal conçu à la fois pour la génération d'images et la compréhension vision-langage. Basé sur une architecture Mixture-of-Transformer-Experts (MoT) de 14B paramètres—avec 7B actifs à l'inférence—BAGEL AI offre des performances de pointe dans la génération texte-en-image, l'édition d'images, et les tâches de compréhension d'images.

Intégré directement dans ComfyUI, BAGEL AI permet aux créateurs de générer des images détaillées à partir de sollicitations en langage naturel, d'éditer des visuels avec des instructions textuelles, et d'exécuter des tâches multimodales comme les questions-réponses visuelles, le sous-titrage, et le raisonnement étape par étape. BAGEL AI combine la qualité des modèles de diffusion (comme Stable Diffusion 3) avec la puissance analytique des VLM de pointe (surpassant des modèles comme Qwen2.5-VL et InternVL-2.5).

Pourquoi Utiliser BAGEL AI ?

BAGEL AI

Le flux de travail BAGEL AI offre :

  • Génération Texte-en-Image : Créez des images de haute qualité à partir de sollicitations en langage naturel en utilisant BAGEL AI
  • Édition d'Images via Texte : Modifiez les images existantes en utilisant des instructions descriptives avec BAGEL AI
  • Compréhension d'Images : Effectuez des sous-titrages d'images, des questions-réponses, et des tâches d'analyse visuelle dans BAGEL AI
  • Raisonnement Multimodal : Activez une explication ou une analyse étape par étape des entrées visuelles via BAGEL AI
  • Modèle Fondamental Tout-en-Un : Utilisez une seule architecture MoT de 14B pour des tâches multimodales diversifiées dans BAGEL AI

Avec BAGEL AI, les artistes, chercheurs, et développeurs peuvent explorer à la fois les capacités génératives et analytiques de l'IA multimodale en utilisant une interface ComfyUI unifiée et extensible propulsée par la technologie BAGEL AI.

1 - Génération Texte-en-Image avec BAGEL AI

BAGEL AI

Générer des Images à l'Aide de Sollicitations en Langage Naturel

BAGEL AI vous permet de créer des images de haute qualité directement à partir d'entrées textuelles. Pour commencer avec BAGEL AI :

  1. Entrez une sollicitation textuelle détaillée dans le nœud d'entrée Prompt dans BAGEL AI.
  2. Configurez éventuellement des paramètres comme la graine, le rapport d'aspect, ou les étapes de décodage dans BAGEL AI.
  3. Exécutez le flux de travail BAGEL AI pour générer une nouvelle image à partir du modèle BAGEL.

Cette fonction de BAGEL AI est idéale pour l'art conceptuel, l'idéation visuelle, la narration, ou le prototypage rapide en utilisant uniquement des descriptions en langage naturel.

2 - Compréhension d'Images et Questions-Réponses Visuelles avec BAGEL AI

BAGEL AI

Analyser et Comprendre les Images à l'Aide du Langage

BAGEL AI inclut des fonctionnalités avancées de raisonnement et de compréhension multimodale, faisant de BAGEL AI un choix idéal pour le sous-titrage d'images, l'analyse, et les questions-réponses :

  1. Téléchargez une image à analyser dans BAGEL AI.
  2. Tapez une question ou sollicitation concernant l'image dans BAGEL AI (par exemple, "Que tient l'homme ?", "Décrivez cette scène.").
  3. Le système BAGEL AI retourne une réponse visuelle ou une trace de raisonnement basée sur le contenu de l'image.
    Cette fonctionnalité de BAGEL AI est particulièrement utile pour l'éducation, le balisage de contenu, les flux de travail d'accessibilité, ou les agents IA nécessitant un ancrage visuel à travers les capacités de BAGEL AI.

3 - Édition d'Images avec Instructions Textuelles dans BAGEL AI

BAGEL AI

Modifier des Images Existantes via l'Édition Basée sur des Sollicitations

BAGEL AI prend également en charge l'édition d'images basée sur des sollicitations via son interface avancée BAGEL AI. Voici comment utiliser BAGEL AI :

  1. Téléchargez votre image originale dans le nœud d'entrée BAGEL AI.
  2. Fournissez une instruction textuelle décrivant la modification souhaitée dans BAGEL AI (par exemple, "ajouter un fond de coucher de soleil", "faire neiger", etc.).
  3. Exécutez le groupe de nœuds pour appliquer vos modifications souhaitées en utilisant le traitement BAGEL AI.

Cela permet aux artistes et designers de transformer des images de manière non destructive à travers un texte simple sans avoir besoin d'une édition photo manuelle, le tout propulsé par la technologie BAGEL AI.

Remerciements

Le flux de travail BAGEL AI pour ComfyUI est basé sur le modèle open-source BAGEL-7B-MoT par ByteDance Seed.
L'intégration ComfyUI et la configuration du flux de travail BAGEL AI ont été développées par neverbiasu, offrant un accès sans couture à la génération d'images, l'édition, et les capacités de compréhension dans une interface unifiée BAGEL AI.

Répertoire GitHub :

Informations sur le Modèle BAGEL AI

  • Nom du Modèle : ComfyUI BAGEL-7B-MoT
  • Architecture : Mixture-of-Transformer-Experts (MoT) optimisée pour BAGEL AI
  • Paramètres Totaux : 14B (7B Actifs) dans BAGEL AI
  • Chemin ComfyUI : models/bagel/ComfyUI-BAGEL-7B-MoT/
  • Téléchargement Automatique : Activé pour BAGEL AI
  • Téléchargement Manuel :

Vous voulez plus de workflows ComfyUI ?

RunComfy
Droits d'auteur 2025 RunComfy. Tous droits réservés.

RunComfy est la première ComfyUI plateforme, offrant des ComfyUI en ligne environnement et services, ainsi que des workflows ComfyUI proposant des visuels époustouflants. RunComfy propose également AI Playground, permettant aux artistes d'utiliser les derniers outils d'IA pour créer des œuvres d'art incroyables.