ComfyUI  >  工作流程  >  BAGEL AI | T2I + I2T + I2I

BAGEL AI | T2I + I2T + I2I

BAGEL AI 是一個開源的多模態基礎模型,擁有 7B 活躍參數(總計 14B)和 Mixture-of-Transformer-Experts (MoT) 設計。專為多模態任務如文字轉圖像生成、圖像編輯和視覺問答而建構,BAGEL AI 在基準測試中超越了像 Qwen2.5-VL 和 InternVL-2.5 等頂級開放 VLM。它還提供與專業模型如 SD3 相當的高質量生成能力。 BAGEL AI 支持自然語言提示、複雜推理,並可選擇性地了解模型的決策過程,為 ComfyUI 的先進多模態工作流程提供了一體化解決方案。

ComfyUI BAGEL AI 工作流程

BAGEL AI | Advanced Text-to-Image & Visual Chat
想要運行這個工作流程嗎?
  • 完全可操作的工作流程
  • 沒有缺失的節點或模型
  • 無需手動設置
  • 具有驚豔的視覺效果

ComfyUI BAGEL AI 範例

bagel-ai-advanced-text-to-image-visual-chat-1229-example_01.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_02.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_03.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_04.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_05.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_06.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_07.webp

ComfyUI BAGEL AI 說明

BAGEL AI: 用於 ComfyUI 的多模態基礎模型

BAGEL (BAndwidth-efficient Generalist Expert Learner) AI 是一個強大的多模態基礎模型,設計用於 圖像生成視覺語言理解。基於具有 14B 參數的 Transformer 專家混合架構(Mixture-of-Transformer-Experts, MoT)——推理時啟用 7B 活躍參數——BAGEL AI 在文字轉圖像生成、圖像編輯和圖像理解任務中提供了最先進的性能。

直接集成到 ComfyUI 中,BAGEL AI 允許創作者從自然語言提示生成詳細圖像,透過文本指令編輯視覺內容,並執行多模態任務,如視覺問答、字幕生成和逐步推理。BAGEL AI 結合了擴散模型(如 Stable Diffusion 3)的質量和領先 VLM 的分析能力(勝過像 Qwen2.5-VL 和 InternVL-2.5 這樣的模型)。

為什麼使用 BAGEL AI?

BAGEL AI

BAGEL AI 工作流程提供:

  • 文字轉圖像生成:使用 BAGEL AI 從自然語言提示創建高質量的圖像
  • 透過文本進行圖像編輯:使用描述性指令修改現有圖像,使用 BAGEL AI
  • 圖像理解:在 BAGEL AI 中執行圖像字幕生成、問答和視覺分析任務
  • 多模態推理:透過 BAGEL AI 啟用逐步解釋或分析視覺輸入
  • 一體化基礎模型:在 BAGEL AI 中使用單一的 14B MoT 架構進行多樣的多模態任務

透過 BAGEL AI,藝術家、研究人員和開發者可以使用一個統一且可擴展的 ComfyUI 介面,探索多模態 AI 的生成和分析能力,這一切都由 BAGEL AI 技術提供支持。

1 - 使用 BAGEL AI 進行文字轉圖像生成

BAGEL AI

使用自然語言提示生成圖像

BAGEL AI 允許您直接從文本輸入創建高質量的圖像。要開始使用 BAGEL AI:

  1. 在 BAGEL AI 中的 Prompt 輸入節點中輸入詳細的 文本提示
  2. 可選地在 BAGEL AI 中配置參數,如種子、長寬比或解碼步驟。
  3. 運行 BAGEL AI 工作流程,從 BAGEL 模型生成新圖像。

此 BAGEL AI 功能非常適合於概念藝術、視覺創意、故事講述或使用純自然語言描述進行快速原型設計。

2 - 使用 BAGEL AI 進行圖像理解和視覺問答

BAGEL AI

使用語言分析和理解圖像

BAGEL AI 包含先進的多模態推理和理解功能,BAGEL AI 是圖像字幕生成、分析和問答的理想選擇:

  1. 在 BAGEL AI 中上傳要 分析的圖像
  2. 在 BAGEL AI 中輸入關於圖像的 問題或提示(例如,「那個人拿著什麼?」,「描述這個場景。」)。
  3. BAGEL AI 系統根據圖像內容返回視覺答案或推理過程。
    此 BAGEL AI 功能特別適用於教育、內容標記、無障礙工作流程或需要視覺基礎的 AI 代理,通過 BAGEL AI 能力實現。

3 - 在 BAGEL AI 中使用文本指令進行圖像編輯

BAGEL AI

通過提示式編輯修改現有圖像

BAGEL AI 還支持通過其先進的 BAGEL AI 介面進行提示式圖像編輯。以下是如何使用 BAGEL AI:

  1. 在 BAGEL AI 輸入節點中上傳您的 原始圖像
  2. 在 BAGEL AI 中提供描述您想要的修改的 文本指令(例如,「添加夕陽背景」,「讓它下雪」等)。
  3. 運行節點組以使用 BAGEL AI 處理應用您想要的編輯。

這使得藝術家和設計師可以通過簡單的文本非破壞性地轉換圖像,而不需要手動照片編輯,所有這些都由 BAGEL AI 技術提供支持。

致謝

BAGEL AI 工作流程是基於開源的 BAGEL-7B-MoT 模型,由 ByteDance Seed 提供。
ComfyUI 的集成和 BAGEL AI 工作流程設置由 neverbiasu 開發,提供了在單一統一的 BAGEL AI 介面內無縫訪問圖像生成、編輯和理解功能。

GitHub Repository:

BAGEL AI 模型信息

  • 模型名稱: ComfyUI BAGEL-7B-MoT
  • 架構: 專為 BAGEL AI 優化的 Transformer 專家混合架構(MoT)
  • 總參數: 14B(7B 活躍)在 BAGEL AI 中
  • ComfyUI 路徑: models/bagel/ComfyUI-BAGEL-7B-MoT/
  • 自動下載: 為 BAGEL AI 啟用
  • 手動下載:

想要更多 ComfyUI 工作流程嗎?

RunComfy
版權 2025 RunComfy. 保留所有權利。

RunComfy 是首選的 ComfyUI 平台,提供 ComfyUI 在線 環境和服務,以及 ComfyUI 工作流程 具有驚豔的視覺效果。 RunComfy還提供 AI Playground, 幫助藝術家利用最新的AI工具創作出令人驚艷的藝術作品。