logo
RunComfy
ComfyUIPlaygroundPricing
discord logo
Loading...
ComfyUI>ワークフロー>BAGEL AI | T2I + I2T + I2I

BAGEL AI | T2I + I2T + I2I

Workflow Name: RunComfy/BAGEL
Workflow ID: 0000...1229
BAGEL AIは、7Bのアクティブパラメータ(合計14B)とMixture-of-Transformer-Experts (MoT)デザインを備えたオープンソースのマルチモーダル基盤モデルです。テキストから画像生成、画像編集、ビジュアル質問応答のようなマルチモーダルタスクのために構築されており、BAGEL AIはQwen2.5-VLやInternVL-2.5などのトップクラスのオープンVLMをベンチマークテストで上回ります。また、SD3のような専門モデルと同等の高品質な生成能力を提供します。 自然言語プロンプト、複雑な推論、およびモデルの意思決定プロセスへのオプションの透明性をサポートすることで、BAGEL AIはComfyUIでの高度なマルチモーダルワークフローのためのオールインワンソリューションを提供します。
このBAGEL AIワークフローは、ComfyUI-BAGEL統合を開発したneverbiasuの作業に基づいています。彼らの努力により、高度なマルチモーダル生成、理解、および推論機能がComfyUIエコシステムに導入されました。

ComfyUI BAGEL AI Workflow

BAGEL AI | Advanced Text-to-Image & Visual Chat
Want to run this workflow?
  • Fully operational workflows
  • No missing nodes or models
  • No manual setups required
  • Features stunning visuals

ComfyUI BAGEL AI Examples

bagel-ai-advanced-text-to-image-visual-chat-1229-example_01.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_02.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_03.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_04.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_05.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_06.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_07.webp

BAGEL AI: ComfyUIのためのマルチモーダル基盤モデル

BAGEL (BAndwidth-efficient Generalist Expert Learner) AIは、画像生成と視覚-言語の理解の両方のために設計された強力なマルチモーダル基盤モデルです。推論時に7Bがアクティブな14BパラメータのMixture-of-Transformer-Experts (MoT)アーキテクチャに基づいており、テキストから画像への生成、画像編集、画像理解タスクで最先端の性能を発揮します。

ComfyUIに直接統合されており、BAGEL AIを使用すると、自然言語プロンプトから詳細な画像を生成し、テキストによる指示でビジュアルを編集し、ビジュアルQ&A、キャプション付け、ステップバイステップの推論のようなマルチモーダルタスクを実行できます。BAGEL AIは、拡散モデル(Stable Diffusion 3のようなもの)と、Qwen2.5-VLやInternVL-2.5のようなリーディングVLMを上回る分析力を組み合わせています。

なぜBAGEL AIを使用するのか?

BAGEL AI

BAGEL AIワークフローは以下を提供します:

  • テキストから画像生成: BAGEL AIを使用して自然言語プロンプトから高品質の画像を作成
  • テキストを介した画像編集: BAGEL AIを使用して説明的な指示で既存の画像を修正
  • 画像理解: BAGEL AIで画像のキャプション付け、Q&A、およびビジュアル分析タスクを実行
  • マルチモーダル推論: BAGEL AIを通じて視覚入力のステップバイステップの説明または分析を可能に
  • オールインワン基盤モデル: BAGEL AI内で多様なマルチモーダルタスクのために単一の14B MoTベースのアーキテクチャを使用

BAGEL AIを使用すると、アーティスト、研究者、開発者は、BAGEL AIテクノロジーによって強化された統一された拡張可能なComfyUIインターフェースを使用して、マルチモーダルAIの生成および分析能力を探求できます。

1 - BAGEL AIによるテキストから画像生成

BAGEL AI

自然言語プロンプトを使用して画像を生成

BAGEL AIを使用すると、テキスト入力から直接高品質の画像を作成できます。BAGEL AIを始めるには:

  1. BAGEL AIのPrompt入力ノードに詳細なテキストプロンプトを入力します。
  2. 必要に応じて、BAGEL AI内でシード、アスペクト比、デコードステップなどのパラメータを設定します。
  3. BAGEL AIワークフローを実行してBAGELモデルから新しい画像を生成します。

このBAGEL AI機能は、コンセプトアート、ビジュアルアイディエーション、ストーリーテリング、または純粋に自然言語記述を使用した迅速なプロトタイピングに最適です。

2 - BAGEL AIによる画像理解とビジュアルQ&A

BAGEL AI

言語を使用して画像を分析および理解

BAGEL AIには高度なマルチモーダル推論と理解機能が含まれており、BAGEL AIは画像のキャプション付け、分析、およびQ&Aに最適です:

  1. BAGEL AIに分析する画像をアップロードします。
  2. BAGEL AIで画像についての質問またはプロンプトを入力します(例:「男性が持っているものは何ですか?」「このシーンを説明してください。」)。
  3. BAGEL AIシステムは、画像コンテンツに基づいてビジュアルな回答または推論のトレースを返します。
    このBAGEL AI機能は特に教育、コンテンツタグ付け、アクセシビリティワークフロー、またはBAGEL AI機能による視覚的な基盤を必要とするAIエージェントに役立ちます。

3 - BAGEL AIでのテキスト指示を使用した画像編集

BAGEL AI

プロンプトベースの編集で既存の画像を修正

BAGEL AIはまた、BAGEL AIの高度なインターフェースを通じてプロンプトベースの画像編集をサポートしています。BAGEL AIの使用方法:

  1. BAGEL AI入力ノードに元の画像をアップロードします。
  2. BAGEL AIで行いたい修正を説明するテキスト指示を提供します(例:「夕日を背景に追加」、「雪を降らせる」など)。
  3. ノードグループを実行して、BAGEL AI処理を使用して希望の編集を適用します。

これにより、アーティストやデザイナーは手動の写真編集を必要とせずに、シンプルなテキストを通じて画像を非破壊的に変換でき、すべてBAGEL AIテクノロジーによって強化されています。

謝辞

ComfyUIのためのBAGEL AIワークフローは、ByteDance SeedによるオープンソースのBAGEL-7B-MoTモデルに基づいています。
ComfyUI統合およびBAGEL AIワークフローのセットアップはneverbiasuによって開発され、統一されたBAGEL AIインターフェース内で画像生成、編集、および理解機能へのシームレスなアクセスを提供しています。

GitHubリポジトリ: https://github.com/neverbiasu/ComfyUI-BAGEL

BAGEL AIモデル情報

  • モデル名: ComfyUI BAGEL-7B-MoT
  • アーキテクチャ: BAGEL AIのために最適化されたMixture-of-Transformer-Experts (MoT)
  • 総パラメータ数: BAGEL AIで14B(7Bアクティブ)
  • ComfyUIパス: models/bagel/ComfyUI-BAGEL-7B-MoT/
  • 自動ダウンロード: BAGEL AIで有効
  • 手動ダウンロード: https://huggingface.co/ByteDance-Seed/BAGEL-7B-MoT

Want More ComfyUI Workflows?

ACE-Step 音楽生成 | AI オーディオ作成

画期的な拡散技術でスタジオ品質の音楽を15倍速く生成します。

ICEdit | 高速 AI 画像編集 with Nunchaku

ICEdit+Nunchaku: 超高速で正確な AI 画像編集のソリューション。

Step1X-Edit | AI画像編集ツール

Step1X-Editで自然言語で11の編集操作を実行します。

LBM Relighting | I2I

LBMを使用して画像ベースの照明入力で被写体を再照明します。

LayerDiffuse + TripoSR | 画像から3Dへ

LayerDiffuseで画像の透明化を行い、TripoSRで素早く3Dオブジェクトを作成

ComfyUI PhotoMakerV2 | リアルな写真を作成

ComfyUI PhotoMakerV2 | リアルな写真を作成

テキストプロンプトからリアルな個人写真を作成し、アイデンティティを保護

IPAdapter Plus (V2) 注意マスク | 画像からビデオへ

IPAdapter Plus 注意マスクを活用し、画像生成プロセスを正確に制御します。

IPAdapter Plus(V2)| 服を変更

IPAdapter Plus(V2)| 服を変更

ファッションモデルの作成にはIPAdapter Plusを使用し、アウトフィットとスタイルを簡単に変更できます

フォローする
  • LinkedIn
  • Facebook
  • Instagram
  • Twitter
サポート
  • Discord
  • メール
  • システムステータス
  • アフィリエイト
リソース
  • 無料のComfyUIオンライン
  • ComfyUIガイド
  • RunComfy API
  • ComfyUIチュートリアル
  • ComfyUIノード
  • 詳細を見る
法的情報
  • 利用規約
  • プライバシーポリシー
  • Cookieポリシー
RunComfy
著作権 2025 RunComfy. All Rights Reserved.

RunComfyは最高の ComfyUI プラットフォームです。次のものを提供しています: ComfyUIオンライン 環境とサービス、および ComfyUIワークフロー 魅力的なビジュアルが特徴です。 RunComfyはまた提供します AI Playground, アーティストが最新のAIツールを活用して素晴らしいアートを作成できるようにする。