BAGEL (BAndwidth-efficient Generalist Expert Learner) AI 是一個強大的多模態基礎模型,設計用於 圖像生成 和 視覺語言理解。基於具有 14B 參數的 Transformer 專家混合架構(Mixture-of-Transformer-Experts, MoT)——推理時啟用 7B 活躍參數——BAGEL AI 在文字轉圖像生成、圖像編輯和圖像理解任務中提供了最先進的性能。
直接集成到 ComfyUI 中,BAGEL AI 允許創作者從自然語言提示生成詳細圖像,透過文本指令編輯視覺內容,並執行多模態任務,如視覺問答、字幕生成和逐步推理。BAGEL AI 結合了擴散模型(如 Stable Diffusion 3)的質量和領先 VLM 的分析能力(勝過像 Qwen2.5-VL 和 InternVL-2.5 這樣的模型)。
BAGEL AI 工作流程提供:
透過 BAGEL AI,藝術家、研究人員和開發者可以使用一個統一且可擴展的 ComfyUI 介面,探索多模態 AI 的生成和分析能力,這一切都由 BAGEL AI 技術提供支持。
BAGEL AI 允許您直接從文本輸入創建高質量的圖像。要開始使用 BAGEL AI:
Prompt
輸入節點中輸入詳細的 文本提示。此 BAGEL AI 功能非常適合於概念藝術、視覺創意、故事講述或使用純自然語言描述進行快速原型設計。
BAGEL AI 包含先進的多模態推理和理解功能,BAGEL AI 是圖像字幕生成、分析和問答的理想選擇:
BAGEL AI 還支持通過其先進的 BAGEL AI 介面進行提示式圖像編輯。以下是如何使用 BAGEL AI:
這使得藝術家和設計師可以通過簡單的文本非破壞性地轉換圖像,而不需要手動照片編輯,所有這些都由 BAGEL AI 技術提供支持。
BAGEL AI 工作流程是基於開源的 BAGEL-7B-MoT 模型,由 ByteDance Seed 提供。
ComfyUI 的集成和 BAGEL AI 工作流程設置由 neverbiasu 開發,提供了在單一統一的 BAGEL AI 介面內無縫訪問圖像生成、編輯和理解功能。
GitHub Repository:
models/bagel/ComfyUI-BAGEL-7B-MoT/
RunComfy 是首選的 ComfyUI 平台,提供 ComfyUI 在線 環境和服務,以及 ComfyUI 工作流程 具有驚豔的視覺效果。 RunComfy還提供 AI Playground, 幫助藝術家利用最新的AI工具創作出令人驚艷的藝術作品。