BAGEL AI | 高度なテキストから画像への変換とビジュアルチャット

このBAGEL AIワークフローは、ComfyUI-BAGEL統合を開発したneverbiasuの作業に基づいています。彼らの努力により、高度なマルチモーダル生成、理解、および推論機能がComfyUIエコシステムに導入されました。

ComfyUI BAGEL AI Workflow

BAGEL AI | Advanced Text-to-Image & Visual Chat

Want to run this workflow?

Fully operational workflows
No missing nodes or models
No manual setups required
Features stunning visuals

ComfyUI BAGEL AI Examples

bagel-ai-advanced-text-to-image-visual-chat-1229-example_01.webp

bagel-ai-advanced-text-to-image-visual-chat-1229-example_02.webp

bagel-ai-advanced-text-to-image-visual-chat-1229-example_03.webp

bagel-ai-advanced-text-to-image-visual-chat-1229-example_04.webp

bagel-ai-advanced-text-to-image-visual-chat-1229-example_05.webp

bagel-ai-advanced-text-to-image-visual-chat-1229-example_06.webp

bagel-ai-advanced-text-to-image-visual-chat-1229-example_07.webp

BAGEL AI: ComfyUIのためのマルチモーダル基盤モデル#

BAGEL (BAndwidth-efficient Generalist Expert Learner) AIは、画像生成と視覚-言語の理解の両方のために設計された強力なマルチモーダル基盤モデルです。推論時に7Bがアクティブな14BパラメータのMixture-of-Transformer-Experts (MoT)アーキテクチャに基づいており、テキストから画像への生成、画像編集、画像理解タスクで最先端の性能を発揮します。

ComfyUIに直接統合されており、BAGEL AIを使用すると、自然言語プロンプトから詳細な画像を生成し、テキストによる指示でビジュアルを編集し、ビジュアルQ&A、キャプション付け、ステップバイステップの推論のようなマルチモーダルタスクを実行できます。BAGEL AIは、拡散モデル（Stable Diffusion 3のようなもの）と、Qwen2.5-VLやInternVL-2.5のようなリーディングVLMを上回る分析力を組み合わせています。

なぜBAGEL AIを使用するのか？#

BAGEL AIワークフローは以下を提供します:

テキストから画像生成: BAGEL AIを使用して自然言語プロンプトから高品質の画像を作成
テキストを介した画像編集: BAGEL AIを使用して説明的な指示で既存の画像を修正
画像理解: BAGEL AIで画像のキャプション付け、Q&A、およびビジュアル分析タスクを実行
マルチモーダル推論: BAGEL AIを通じて視覚入力のステップバイステップの説明または分析を可能に
オールインワン基盤モデル: BAGEL AI内で多様なマルチモーダルタスクのために単一の14B MoTベースのアーキテクチャを使用

BAGEL AIを使用すると、アーティスト、研究者、開発者は、BAGEL AIテクノロジーによって強化された統一された拡張可能なComfyUIインターフェースを使用して、マルチモーダルAIの生成および分析能力を探求できます。

1 - BAGEL AIによるテキストから画像生成#

自然言語プロンプトを使用して画像を生成#

BAGEL AIを使用すると、テキスト入力から直接高品質の画像を作成できます。BAGEL AIを始めるには:

BAGEL AIのPrompt入力ノードに詳細なテキストプロンプトを入力します。
必要に応じて、BAGEL AI内でシード、アスペクト比、デコードステップなどのパラメータを設定します。
BAGEL AIワークフローを実行してBAGELモデルから新しい画像を生成します。

このBAGEL AI機能は、コンセプトアート、ビジュアルアイディエーション、ストーリーテリング、または純粋に自然言語記述を使用した迅速なプロトタイピングに最適です。

2 - BAGEL AIによる画像理解とビジュアルQ&A#

言語を使用して画像を分析および理解#

BAGEL AIには高度なマルチモーダル推論と理解機能が含まれており、BAGEL AIは画像のキャプション付け、分析、およびQ&Aに最適です:

BAGEL AIに分析する画像をアップロードします。
BAGEL AIで画像についての質問またはプロンプトを入力します（例：「男性が持っているものは何ですか？」「このシーンを説明してください。」）。
BAGEL AIシステムは、画像コンテンツに基づいてビジュアルな回答または推論のトレースを返します。

このBAGEL AI機能は特に教育、コンテンツタグ付け、アクセシビリティワークフロー、またはBAGEL AI機能による視覚的な基盤を必要とするAIエージェントに役立ちます。

3 - BAGEL AIでのテキスト指示を使用した画像編集#

プロンプトベースの編集で既存の画像を修正#

BAGEL AIはまた、BAGEL AIの高度なインターフェースを通じてプロンプトベースの画像編集をサポートしています。BAGEL AIの使用方法:

BAGEL AI入力ノードに元の画像をアップロードします。
BAGEL AIで行いたい修正を説明するテキスト指示を提供します（例：「夕日を背景に追加」、「雪を降らせる」など）。
ノードグループを実行して、BAGEL AI処理を使用して希望の編集を適用します。

これにより、アーティストやデザイナーは手動の写真編集を必要とせずに、シンプルなテキストを通じて画像を非破壊的に変換でき、すべてBAGEL AIテクノロジーによって強化されています。

謝辞#

ComfyUIのためのBAGEL AIワークフローは、ByteDance SeedによるオープンソースのBAGEL-7B-MoTモデルに基づいています。 ComfyUI統合およびBAGEL AIワークフローのセットアップはneverbiasuによって開発され、統一されたBAGEL AIインターフェース内で画像生成、編集、および理解機能へのシームレスなアクセスを提供しています。

GitHubリポジトリ: https://github.com/neverbiasu/ComfyUI-BAGEL

BAGEL AIモデル情報#

モデル名: ComfyUI BAGEL-7B-MoT
アーキテクチャ: BAGEL AIのために最適化されたMixture-of-Transformer-Experts (MoT)
総パラメータ数: BAGEL AIで14B（7Bアクティブ）
ComfyUIパス: models/bagel/ComfyUI-BAGEL-7B-MoT/
自動ダウンロード: BAGEL AIで有効
手動ダウンロード: https://huggingface.co/ByteDance-Seed/BAGEL-7B-MoT

Want More ComfyUI Workflows?

ACE-Step 音楽生成 | AI オーディオ作成

画期的な拡散技術でスタジオ品質の音楽を15倍速く生成します。

ICEdit | 高速 AI 画像編集 with Nunchaku

ICEdit+Nunchaku: 超高速で正確な AI 画像編集のソリューション。

Step1X-Edit | AI画像編集ツール

Step1X-Editで自然言語で11の編集操作を実行します。

LBM Relighting | I2I

LBMを使用して画像ベースの照明入力で被写体を再照明します。

Qwen Image 2512 LoRA 推論 | AI Toolkit ComfyUI

AI ToolkitでトレーニングされたLoRAを使用して、ComfyUIでQwen Image 2512を1つのRCQwenImage2512ノードを介してプレビューに一致した生成を行います。

LayerDiffuse | テキストから透明な画像へ

LayerDiffuseを使用して、透明な画像を生成したり、背景と前景を互いにブレンドしたりします。

IndexTTS2 ComfyUI ワークフロー | 表現豊かな音声ジェネレーター

本物の感情をクローン。どんなトーンでも瞬時に話す。

CogvideoX Fun | Video-to-Video Model

CogVideoX Fun: 高品質なビデオ生成のための高度なビデオツービデオモデル。

フォローする

サポート

リソース

法的情報

RunComfy

RunComfyは最高の ComfyUI プラットフォームです。次のものを提供しています: ComfyUIオンライン環境とサービス、および ComfyUIワークフロー魅力的なビジュアルが特徴です。 RunComfyはまた提供します AI Models, アーティストが最新のAIツールを活用して素晴らしいアートを作成できるようにする。

BAGEL AI | T2I + I2T + I2I