BAGEL AI | 先進的文字轉圖像與視覺聊天

此 BAGEL AI 工作流程基於 neverbiasu 的工作，他們開發了 ComfyUI-BAGEL 集成。其努力將先進的多模態生成、理解和推理能力引入 ComfyUI 生態系統。

ComfyUI BAGEL AI Workflow

BAGEL AI | Advanced Text-to-Image & Visual Chat

Want to run this workflow?

Fully operational workflows
No missing nodes or models
No manual setups required
Features stunning visuals

ComfyUI BAGEL AI Examples

bagel-ai-advanced-text-to-image-visual-chat-1229-example_01.webp

bagel-ai-advanced-text-to-image-visual-chat-1229-example_02.webp

bagel-ai-advanced-text-to-image-visual-chat-1229-example_03.webp

bagel-ai-advanced-text-to-image-visual-chat-1229-example_04.webp

bagel-ai-advanced-text-to-image-visual-chat-1229-example_05.webp

bagel-ai-advanced-text-to-image-visual-chat-1229-example_06.webp

bagel-ai-advanced-text-to-image-visual-chat-1229-example_07.webp

BAGEL AI: 用於 ComfyUI 的多模態基礎模型#

BAGEL (BAndwidth-efficient Generalist Expert Learner) AI 是一個強大的多模態基礎模型，設計用於 圖像生成 和 視覺語言理解。基於具有 14B 參數的 Transformer 專家混合架構（Mixture-of-Transformer-Experts, MoT）——推理時啟用 7B 活躍參數——BAGEL AI 在文字轉圖像生成、圖像編輯和圖像理解任務中提供了最先進的性能。

直接集成到 ComfyUI 中，BAGEL AI 允許創作者從自然語言提示生成詳細圖像，透過文本指令編輯視覺內容，並執行多模態任務，如視覺問答、字幕生成和逐步推理。BAGEL AI 結合了擴散模型（如 Stable Diffusion 3）的質量和領先 VLM 的分析能力（勝過像 Qwen2.5-VL 和 InternVL-2.5 這樣的模型）。

為什麼使用 BAGEL AI？#

BAGEL AI 工作流程提供：

文字轉圖像生成：使用 BAGEL AI 從自然語言提示創建高質量的圖像
透過文本進行圖像編輯：使用描述性指令修改現有圖像，使用 BAGEL AI
圖像理解：在 BAGEL AI 中執行圖像字幕生成、問答和視覺分析任務
多模態推理：透過 BAGEL AI 啟用逐步解釋或分析視覺輸入
一體化基礎模型：在 BAGEL AI 中使用單一的 14B MoT 架構進行多樣的多模態任務

透過 BAGEL AI，藝術家、研究人員和開發者可以使用一個統一且可擴展的 ComfyUI 介面，探索多模態 AI 的生成和分析能力，這一切都由 BAGEL AI 技術提供支持。

1 - 使用 BAGEL AI 進行文字轉圖像生成#

使用自然語言提示生成圖像#

BAGEL AI 允許您直接從文本輸入創建高質量的圖像。要開始使用 BAGEL AI：

在 BAGEL AI 中的 Prompt 輸入節點中輸入詳細的 文本提示。
可選地在 BAGEL AI 中配置參數，如種子、長寬比或解碼步驟。
運行 BAGEL AI 工作流程，從 BAGEL 模型生成新圖像。

此 BAGEL AI 功能非常適合於概念藝術、視覺創意、故事講述或使用純自然語言描述進行快速原型設計。

2 - 使用 BAGEL AI 進行圖像理解和視覺問答#

使用語言分析和理解圖像#

BAGEL AI 包含先進的多模態推理和理解功能，BAGEL AI 是圖像字幕生成、分析和問答的理想選擇：

在 BAGEL AI 中上傳要 分析的圖像。
在 BAGEL AI 中輸入關於圖像的 問題或提示（例如，「那個人拿著什麼？」，「描述這個場景。」）。
BAGEL AI 系統根據圖像內容返回視覺答案或推理過程。

此 BAGEL AI 功能特別適用於教育、內容標記、無障礙工作流程或需要視覺基礎的 AI 代理，通過 BAGEL AI 能力實現。

3 - 在 BAGEL AI 中使用文本指令進行圖像編輯#

通過提示式編輯修改現有圖像#

BAGEL AI 還支持通過其先進的 BAGEL AI 介面進行提示式圖像編輯。以下是如何使用 BAGEL AI：

在 BAGEL AI 輸入節點中上傳您的 原始圖像。
在 BAGEL AI 中提供描述您想要的修改的 文本指令（例如，「添加夕陽背景」，「讓它下雪」等）。
運行節點組以使用 BAGEL AI 處理應用您想要的編輯。

這使得藝術家和設計師可以通過簡單的文本非破壞性地轉換圖像，而不需要手動照片編輯，所有這些都由 BAGEL AI 技術提供支持。

致謝#

BAGEL AI 工作流程是基於開源的 BAGEL-7B-MoT 模型，由 ByteDance Seed 提供。 ComfyUI 的集成和 BAGEL AI 工作流程設置由 neverbiasu 開發，提供了在單一統一的 BAGEL AI 介面內無縫訪問圖像生成、編輯和理解功能。

GitHub Repository: https://github.com/neverbiasu/ComfyUI-BAGEL