BAGEL (BAndwidth-efficient Generalist Expert Learner) AI는 이미지 생성과 비전-언어 이해 모두를 위해 설계된 강력한 다중 모달 기초 모델입니다. 14B 파라미터 Mixture-of-Transformer-Experts (MoT) 아키텍처를 기반으로 하며, 추론 시 7B가 활성화되어 BAGEL AI는 텍스트-이미지 생성, 이미지 편집 및 이미지 이해 작업 전반에서 최첨단 성능을 제공합니다.
ComfyUI에 직접 통합되어, BAGEL AI는 창작자들이 자연어 프롬프트로부터 상세한 이미지를 생성하고, 텍스트 지시로 시각적 요소를 편집하며, 시각적 Q&A, 캡셔닝 및 단계별 추론과 같은 다중 모달 작업을 수행할 수 있게 합니다. BAGEL AI는 확산 모델(Stable Diffusion 3과 같은)의 품질과 선도적인 VLM의 분석력을 결합하여 Qwen2.5-VL 및 InternVL-2.5와 같은 모델을 능가합니다.
BAGEL AI 워크플로우는 다음을 제공합니다:
BAGEL AI를 통해 예술가, 연구원 및 개발자들은 BAGEL AI 기술로 구동되는 통합되고 확장 가능한 ComfyUI 인터페이스를 사용하여 다중 모달 AI의 생성 및 분석 기능을 탐색할 수 있습니다.
BAGEL AI는 텍스트 입력에서 직접 고품질 이미지를 생성할 수 있게 합니다. BAGEL AI로 시작하려면:
Prompt
입력 노드에 자세한 텍스트 프롬프트를 입력합니다.이 BAGEL AI 기능은 개념 예술, 시각적 아이디어화, 스토리텔링 또는 순수한 자연어 설명을 사용한 신속한 프로토타이핑에 이상적입니다.
BAGEL AI는 고급 다중 모달 추론 및 이해 기능을 포함하고 있어, 이미지 캡셔닝, 분석 및 Q&A에 BAGEL AI가 이상적입니다:
BAGEL AI는 고급 BAGEL AI 인터페이스를 통해 프롬프트 기반 이미지 편집도 지원합니다. BAGEL AI를 사용하는 방법은 다음과 같습니다:
이는 예술가와 디자이너가 수동 사진 편집 없이 간단한 텍스트를 통해 이미지를 비파괴적으로 변환할 수 있게 하며, 모두 BAGEL AI 기술로 구동됩니다.
ComfyUI를 위한 BAGEL AI 워크플로우는 ByteDance Seed의 오픈 소스 BAGEL-7B-MoT 모델을 기반으로 합니다.
ComfyUI 통합 및 BAGEL AI 워크플로우 설정은 neverbiasu에 의해 개발되어, 단일 통합 BAGEL AI 인터페이스 내에서 이미지 생성, 편집 및 이해 기능에 원활하게 액세스할 수 있게 합니다.
GitHub Repository: https://github.com/neverbiasu/ComfyUI-BAGEL
models/bagel/ComfyUI-BAGEL-7B-MoT/
RunComfy는 최고의 ComfyUI 플랫폼으로서 ComfyUI 온라인 환경과 서비스를 제공하며 ComfyUI 워크플로우 멋진 비주얼을 제공합니다. RunComfy는 또한 제공합니다 AI Playground, 예술가들이 최신 AI 도구를 활용하여 놀라운 예술을 창조할 수 있도록 지원합니다.