BAGEL (BAndwidth-efficient Generalist Expert Learner) AI è un potente modello di base multimodale progettato sia per la generazione di immagini che per la comprensione visione-linguaggio. Basato su un'architettura Mixture-of-Transformer-Experts (MoT) di 14B parametri—con 7B attivi durante l'inferenza—BAGEL AI offre prestazioni all'avanguardia in generazione di testo-a-immagine, editing di immagini e compiti di comprensione delle immagini.
Integrato direttamente in ComfyUI, BAGEL AI consente ai creatori di generare immagini dettagliate da suggerimenti in linguaggio naturale, modificare visivi con istruzioni testuali e svolgere compiti multimodali come Q&A visivo, didascalie e ragionamento passo-passo. BAGEL AI combina la qualità dei modelli di diffusione (come Stable Diffusion 3) con la potenza analitica dei principali VLM (superando modelli come Qwen2.5-VL e InternVL-2.5).
Il flusso di lavoro di BAGEL AI offre:
Con BAGEL AI, artisti, ricercatori e sviluppatori possono esplorare sia le capacità generative che analitiche dell'AI multimodale usando un'interfaccia ComfyUI unificata e estensibile alimentata dalla tecnologia BAGEL AI.
BAGEL AI ti consente di creare immagini di alta qualità direttamente da input testuali. Per iniziare con BAGEL AI:
Prompt
in BAGEL AI.Questa funzione di BAGEL AI è ideale per arte concettuale, ideazione visiva, narrazione o prototipazione rapida usando descrizioni puramente in linguaggio naturale.
BAGEL AI include funzionalità avanzate di ragionamento multimodale e comprensione, rendendo BAGEL AI ideale per didascalie di immagini, analisi e Q&A:
BAGEL AI supporta anche l'editing di immagini basato su suggerimenti tramite la sua avanzata interfaccia BAGEL AI. Ecco come usare BAGEL AI:
Ciò consente ad artisti e designer di trasformare immagini in modo non distruttivo tramite semplice testo senza bisogno di editing fotografico manuale, tutto alimentato dalla tecnologia BAGEL AI.
Il flusso di lavoro BAGEL AI per ComfyUI si basa sul modello open-source BAGEL-7B-MoT di ByteDance Seed.
L'integrazione in ComfyUI e l'impostazione del flusso di lavoro BAGEL AI sono stati sviluppati da neverbiasu, fornendo accesso senza soluzione di continuità a capacità di generazione, editing e comprensione delle immagini all'interno di un'unica interfaccia unificata BAGEL AI.
Repository GitHub: https://github.com/neverbiasu/ComfyUI-BAGEL
models/bagel/ComfyUI-BAGEL-7B-MoT/
RunComfy è la piattaforma principale ComfyUI che offre ComfyUI online ambiente e servizi, insieme a workflow di ComfyUI con visuali mozzafiato. RunComfy offre anche AI Playground, consentire agli artisti di sfruttare gli ultimi strumenti di AI per creare arte incredibile.