logo
RunComfy
ComfyUIPlaygroundPricing
discord logo
Loading...
ComfyUI>工作流>BAGEL AI | T2I + I2T + I2I

BAGEL AI | T2I + I2T + I2I

Workflow Name: RunComfy/BAGEL
Workflow ID: 0000...1229
BAGEL AI 是一个开源多模态基础模型,具有 7B 活跃参数(总计 14B)和 Mixture-of-Transformer-Experts (MoT) 设计。BAGEL AI 专为多模态任务(如文本到图像生成、图像编辑和视觉问答)而构建,在基准测试中,其表现优于顶级开放 VLMs,如 Qwen2.5-VL 和 InternVL-2.5。它还提供与专业模型如 SD3 相媲美的高质量生成能力。 支持自然语言提示、复杂推理,以及对模型决策过程的可选透明度,BAGEL AI 为 ComfyUI 中的高级多模态工作流程提供了一体化解决方案。
此 BAGEL AI 工作流基于 neverbiasu 的工作,后者开发了 ComfyUI-BAGEL 集成。他们的努力将先进的多模态生成、理解和推理能力带入 ComfyUI 生态系统。

ComfyUI BAGEL AI Workflow

BAGEL AI | Advanced Text-to-Image & Visual Chat
Want to run this workflow?
  • Fully operational workflows
  • No missing nodes or models
  • No manual setups required
  • Features stunning visuals

ComfyUI BAGEL AI Examples

bagel-ai-advanced-text-to-image-visual-chat-1229-example_01.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_02.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_03.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_04.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_05.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_06.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_07.webp

BAGEL AI:用于 ComfyUI 的多模态基础模型

BAGEL (BAndwidth-efficient Generalist Expert Learner) AI 是一个强大的多模态基础模型,专为 图像生成 和 视觉-语言理解 设计。基于 14B 参数的 Transformer 专家混合体 (MoT) 架构—推理时 7B 活跃—BAGEL AI 在文本到图像生成、图像编辑和图像理解任务中提供了最先进的性能。

直接集成到 ComfyUI 中,BAGEL AI 允许创作者通过自然语言提示生成详细图像,使用文本指令编辑视觉内容,并执行多模态任务,如视觉问答、字幕生成和逐步推理。BAGEL AI 将扩散模型(如 Stable Diffusion 3)的质量与领先 VLMs 的分析能力相结合,优于如 Qwen2.5-VL 和 InternVL-2.5 的模型。

为什么使用 BAGEL AI?

BAGEL AI

BAGEL AI 工作流提供:

  • 文本到图像生成:使用 BAGEL AI 从自然语言提示创建高质量图像
  • 通过文本进行图像编辑:使用描述性指令修改现有图像,使用 BAGEL AI
  • 图像理解:在 BAGEL AI 中执行图像字幕生成、问答和视觉分析任务
  • 多模态推理:通过 BAGEL AI 启用视觉输入的逐步解释或分析
  • 一体化基础模型:在 BAGEL AI 中使用单一的 14B MoT 架构进行多样化的多模态任务

借助 BAGEL AI,艺术家、研究人员和开发人员可以通过统一且可扩展的 ComfyUI 接口探索多模态 AI 的生成和分析能力,BAGEL AI 技术提供支持。

1 - 使用 BAGEL AI 进行文本到图像生成

BAGEL AI

使用自然语言提示生成图像

BAGEL AI 允许您直接从文本输入创建高质量图像。要开始使用 BAGEL AI:

  1. 在 BAGEL AI 中的 Prompt 输入节点中输入详细的 文本提示。
  2. 可选地在 BAGEL AI 中配置参数,如种子、长宽比或解码步骤。
  3. 运行 BAGEL AI 工作流以从 BAGEL 模型生成新图像。

此 BAGEL AI 功能非常适合于概念艺术、视觉创意、故事讲述或使用纯自然语言描述进行快速原型设计。

2 - 使用 BAGEL AI 进行图像理解和视觉问答

BAGEL AI

使用语言分析和理解图像

BAGEL AI 包含先进的多模态推理和理解功能,使 BAGEL AI 成为图像字幕生成、分析和问答的理想选择:

  1. 在 BAGEL AI 中上传要分析的 图像。
  2. 在 BAGEL AI 中键入有关图像的 问题或提示(例如,“这个人拿着什么?”,“描述这个场景。”)。
  3. BAGEL AI 系统根据图像内容返回视觉答案或推理轨迹。
    此 BAGEL AI 功能特别适用于教育、内容标记、可访问性工作流或需要视觉基础的 AI 代理,利用 BAGEL AI 功能。

3 - 在 BAGEL AI 中使用文本指令编辑图像

BAGEL AI

通过基于提示的编辑修改现有图像

BAGEL AI 还支持通过其高级 BAGEL AI 接口进行基于提示的图像编辑。以下是使用 BAGEL AI 的方法:

  1. 在 BAGEL AI 输入节点中上传您的 原始图像。
  2. 在 BAGEL AI 中提供描述您想要的修改的 文本指令(例如,“添加日落背景”,“让它下雪”等)。
  3. 运行节点组以使用 BAGEL AI 处理应用您想要的编辑。

这允许艺术家和设计师通过简单的文本非破坏性地转换图像,而无需手动照片编辑,所有这些都由 BAGEL AI 技术提供支持。

致谢

用于 ComfyUI 的 BAGEL AI 工作流基于 ByteDance Seed 的开源 BAGEL-7B-MoT 模型。
ComfyUI 集成和 BAGEL AI 工作流设置由 neverbiasu 开发,提供无缝访问图像生成、编辑和理解功能,所有这些都在单一统一的 BAGEL AI 接口中实现。

GitHub 仓库:https://github.com/neverbiasu/ComfyUI-BAGEL

BAGEL AI 模型信息

  • 模型名称:ComfyUI BAGEL-7B-MoT
  • 架构:为 BAGEL AI 优化的 Transformer 专家混合体 (MoT)
  • 总参数:BAGEL AI 中的 14B(7B 活跃)
  • ComfyUI 路径:models/bagel/ComfyUI-BAGEL-7B-MoT/
  • 自动下载:为 BAGEL AI 启用
  • 手动下载:https://huggingface.co/ByteDance-Seed/BAGEL-7B-MoT

Want More ComfyUI Workflows?

ACE-Step 音乐生成 | AI 音频创作

利用突破性的扩散技术,生成录音室质量的音乐,速度提高 15 倍。

ICEdit | 使用 Nunchaku 快速 AI 图像编辑

ICEdit+Nunchaku:超快、精确的 AI 图像编辑解决方案。

Step1X-Edit | AI 图像编辑工具

在 Step1X-Edit 中使用自然语言执行 11 项编辑操作。

LBM 重光 | I2I

使用基于图像的光照输入通过 LBM 重光处理主体。

AnimateDiff + 动态提示 | 文本到视频

使用动态提示(通配符)、Animatediff 和 IP-Adapter 生成动态动画或 GIF。

Janus-Pro | T2I + I2T 模型

Janus-Pro:高级文本到图像和图像到文本生成。

ToonCrafter | 生成卡通插值

ToonCrafter可以在两张卡通图像之间生成卡通插值。

Vid2Vid 第 1 部分 | 组合与遮罩

ComfyUI Vid2Vid 提供了两种不同的工作流程来创建高质量、专业的动画:Vid2Vid 第 1 部分,通过专注于原始视频的组合和遮罩来增强您的创意;Vid2Vid 第 2 部分,利用 SDXL Style Transfer 将视频的风格转变为您想要的美学风格。本页面专门介绍 Vid2Vid 第 1 部分。

关注我们
  • 领英
  • Facebook
  • Instagram
  • Twitter
支持
  • Discord
  • 电子邮件
  • 系统状态
  • 附属
资源
  • 免费 ComfyUI 在线版
  • ComfyUI 指南
  • RunComfy API
  • ComfyUI 教程
  • ComfyUI 节点
  • 了解更多
法律
  • 服务条款
  • 隐私政策
  • Cookie 政策
RunComfy
版权 2025 RunComfy. 保留所有权利。

RunComfy 是首选的 ComfyUI 平台,提供 ComfyUI 在线 环境和服务,以及 ComfyUI 工作流 具有惊艳的视觉效果。 RunComfy还提供 AI Playground, 帮助艺术家利用最新的AI工具创作出令人惊叹的艺术作品。