BAGEL AI | T2I + I2T + I2I
BAGEL AI 是一個開源的多模態基礎模型,擁有 7B 活躍參數(總計 14B)和 Mixture-of-Transformer-Experts (MoT) 設計。專為多模態任務如文字轉圖像生成、圖像編輯和視覺問答而建構,BAGEL AI 在基準測試中超越了像 Qwen2.5-VL 和 InternVL-2.5 等頂級開放 VLM。它還提供與專業模型如 SD3 相當的高質量生成能力。 BAGEL AI 支持自然語言提示、複雜推理,並可選擇性地了解模型的決策過程,為 ComfyUI 的先進多模態工作流程提供了一體化解決方案。ComfyUI BAGEL AI 工作流程
ComfyUI BAGEL AI 範例







ComfyUI BAGEL AI 說明
BAGEL AI: 用於 ComfyUI 的多模態基礎模型
BAGEL (BAndwidth-efficient Generalist Expert Learner) AI 是一個強大的多模態基礎模型,設計用於 圖像生成 和 視覺語言理解。基於具有 14B 參數的 Transformer 專家混合架構(Mixture-of-Transformer-Experts, MoT)——推理時啟用 7B 活躍參數——BAGEL AI 在文字轉圖像生成、圖像編輯和圖像理解任務中提供了最先進的性能。
直接集成到 ComfyUI 中,BAGEL AI 允許創作者從自然語言提示生成詳細圖像,透過文本指令編輯視覺內容,並執行多模態任務,如視覺問答、字幕生成和逐步推理。BAGEL AI 結合了擴散模型(如 Stable Diffusion 3)的質量和領先 VLM 的分析能力(勝過像 Qwen2.5-VL 和 InternVL-2.5 這樣的模型)。
為什麼使用 BAGEL AI?
BAGEL AI 工作流程提供:
- 文字轉圖像生成:使用 BAGEL AI 從自然語言提示創建高質量的圖像
- 透過文本進行圖像編輯:使用描述性指令修改現有圖像,使用 BAGEL AI
- 圖像理解:在 BAGEL AI 中執行圖像字幕生成、問答和視覺分析任務
- 多模態推理:透過 BAGEL AI 啟用逐步解釋或分析視覺輸入
- 一體化基礎模型:在 BAGEL AI 中使用單一的 14B MoT 架構進行多樣的多模態任務
透過 BAGEL AI,藝術家、研究人員和開發者可以使用一個統一且可擴展的 ComfyUI 介面,探索多模態 AI 的生成和分析能力,這一切都由 BAGEL AI 技術提供支持。
1 - 使用 BAGEL AI 進行文字轉圖像生成
使用自然語言提示生成圖像
BAGEL AI 允許您直接從文本輸入創建高質量的圖像。要開始使用 BAGEL AI:
- 在 BAGEL AI 中的
Prompt
輸入節點中輸入詳細的 文本提示。 - 可選地在 BAGEL AI 中配置參數,如種子、長寬比或解碼步驟。
- 運行 BAGEL AI 工作流程,從 BAGEL 模型生成新圖像。
此 BAGEL AI 功能非常適合於概念藝術、視覺創意、故事講述或使用純自然語言描述進行快速原型設計。
2 - 使用 BAGEL AI 進行圖像理解和視覺問答
使用語言分析和理解圖像
BAGEL AI 包含先進的多模態推理和理解功能,BAGEL AI 是圖像字幕生成、分析和問答的理想選擇:
- 在 BAGEL AI 中上傳要 分析的圖像。
- 在 BAGEL AI 中輸入關於圖像的 問題或提示(例如,「那個人拿著什麼?」,「描述這個場景。」)。
- BAGEL AI 系統根據圖像內容返回視覺答案或推理過程。
此 BAGEL AI 功能特別適用於教育、內容標記、無障礙工作流程或需要視覺基礎的 AI 代理,通過 BAGEL AI 能力實現。
3 - 在 BAGEL AI 中使用文本指令進行圖像編輯
通過提示式編輯修改現有圖像
BAGEL AI 還支持通過其先進的 BAGEL AI 介面進行提示式圖像編輯。以下是如何使用 BAGEL AI:
- 在 BAGEL AI 輸入節點中上傳您的 原始圖像。
- 在 BAGEL AI 中提供描述您想要的修改的 文本指令(例如,「添加夕陽背景」,「讓它下雪」等)。
- 運行節點組以使用 BAGEL AI 處理應用您想要的編輯。
這使得藝術家和設計師可以通過簡單的文本非破壞性地轉換圖像,而不需要手動照片編輯,所有這些都由 BAGEL AI 技術提供支持。
致謝
BAGEL AI 工作流程是基於開源的 BAGEL-7B-MoT 模型,由 ByteDance Seed 提供。
ComfyUI 的集成和 BAGEL AI 工作流程設置由 neverbiasu 開發,提供了在單一統一的 BAGEL AI 介面內無縫訪問圖像生成、編輯和理解功能。
GitHub Repository:
BAGEL AI 模型信息
- 模型名稱: ComfyUI BAGEL-7B-MoT
- 架構: 專為 BAGEL AI 優化的 Transformer 專家混合架構(MoT)
- 總參數: 14B(7B 活躍)在 BAGEL AI 中
- ComfyUI 路徑:
models/bagel/ComfyUI-BAGEL-7B-MoT/
- 自動下載: 為 BAGEL AI 啟用
- 手動下載: