BAGEL (BAndwidth-efficient Generalist Expert Learner) AI 是一个强大的多模态基础模型,专为 图像生成 和 视觉-语言理解 设计。基于 14B 参数的 Transformer 专家混合体 (MoT) 架构—推理时 7B 活跃—BAGEL AI 在文本到图像生成、图像编辑和图像理解任务中提供了最先进的性能。
直接集成到 ComfyUI 中,BAGEL AI 允许创作者通过自然语言提示生成详细图像,使用文本指令编辑视觉内容,并执行多模态任务,如视觉问答、字幕生成和逐步推理。BAGEL AI 将扩散模型(如 Stable Diffusion 3)的质量与领先 VLMs 的分析能力相结合,优于如 Qwen2.5-VL 和 InternVL-2.5 的模型。
BAGEL AI 工作流提供:
借助 BAGEL AI,艺术家、研究人员和开发人员可以通过统一且可扩展的 ComfyUI 接口探索多模态 AI 的生成和分析能力,BAGEL AI 技术提供支持。
BAGEL AI 允许您直接从文本输入创建高质量图像。要开始使用 BAGEL AI:
Prompt
输入节点中输入详细的 文本提示。此 BAGEL AI 功能非常适合于概念艺术、视觉创意、故事讲述或使用纯自然语言描述进行快速原型设计。
BAGEL AI 包含先进的多模态推理和理解功能,使 BAGEL AI 成为图像字幕生成、分析和问答的理想选择:
BAGEL AI 还支持通过其高级 BAGEL AI 接口进行基于提示的图像编辑。以下是使用 BAGEL AI 的方法:
这允许艺术家和设计师通过简单的文本非破坏性地转换图像,而无需手动照片编辑,所有这些都由 BAGEL AI 技术提供支持。
用于 ComfyUI 的 BAGEL AI 工作流基于 ByteDance Seed 的开源 BAGEL-7B-MoT 模型。
ComfyUI 集成和 BAGEL AI 工作流设置由 neverbiasu 开发,提供无缝访问图像生成、编辑和理解功能,所有这些都在单一统一的 BAGEL AI 接口中实现。
GitHub 仓库:https://github.com/neverbiasu/ComfyUI-BAGEL
models/bagel/ComfyUI-BAGEL-7B-MoT/
RunComfy 是首选的 ComfyUI 平台,提供 ComfyUI 在线 环境和服务,以及 ComfyUI 工作流 具有惊艳的视觉效果。 RunComfy还提供 AI Playground, 帮助艺术家利用最新的AI工具创作出令人惊叹的艺术作品。