ComfyUI  >  ワークフロー  >  BAGEL AI | T2I + I2T + I2I

BAGEL AI | T2I + I2T + I2I

BAGEL AIは、7Bのアクティブパラメータ(合計14B)とMixture-of-Transformer-Experts (MoT)デザインを備えたオープンソースのマルチモーダル基盤モデルです。テキストから画像生成、画像編集、ビジュアル質問応答のようなマルチモーダルタスクのために構築されており、BAGEL AIはQwen2.5-VLやInternVL-2.5などのトップクラスのオープンVLMをベンチマークテストで上回ります。また、SD3のような専門モデルと同等の高品質な生成能力を提供します。 自然言語プロンプト、複雑な推論、およびモデルの意思決定プロセスへのオプションの透明性をサポートすることで、BAGEL AIはComfyUIでの高度なマルチモーダルワークフローのためのオールインワンソリューションを提供します。

ComfyUI BAGEL AI ワークフロー

BAGEL AI | Advanced Text-to-Image & Visual Chat
このワークフローを実行しますか?
  • 完全に動作するワークフロー
  • 欠落したノードやモデルはありません
  • 手動セットアップは不要
  • 魅力的なビジュアルを特徴としています

ComfyUI BAGEL AI 例

bagel-ai-advanced-text-to-image-visual-chat-1229-example_01.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_02.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_03.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_04.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_05.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_06.webp
bagel-ai-advanced-text-to-image-visual-chat-1229-example_07.webp

ComfyUI BAGEL AI 説明

BAGEL AI: ComfyUIのためのマルチモーダル基盤モデル

BAGEL (BAndwidth-efficient Generalist Expert Learner) AIは、画像生成視覚-言語の理解の両方のために設計された強力なマルチモーダル基盤モデルです。推論時に7Bがアクティブな14BパラメータのMixture-of-Transformer-Experts (MoT)アーキテクチャに基づいており、テキストから画像への生成、画像編集、画像理解タスクで最先端の性能を発揮します。

ComfyUIに直接統合されており、BAGEL AIを使用すると、自然言語プロンプトから詳細な画像を生成し、テキストによる指示でビジュアルを編集し、ビジュアルQ&A、キャプション付け、ステップバイステップの推論のようなマルチモーダルタスクを実行できます。BAGEL AIは、拡散モデル(Stable Diffusion 3のようなもの)と、Qwen2.5-VLやInternVL-2.5のようなリーディングVLMを上回る分析力を組み合わせています。

なぜBAGEL AIを使用するのか?

BAGEL AI

BAGEL AIワークフローは以下を提供します:

  • テキストから画像生成: BAGEL AIを使用して自然言語プロンプトから高品質の画像を作成
  • テキストを介した画像編集: BAGEL AIを使用して説明的な指示で既存の画像を修正
  • 画像理解: BAGEL AIで画像のキャプション付け、Q&A、およびビジュアル分析タスクを実行
  • マルチモーダル推論: BAGEL AIを通じて視覚入力のステップバイステップの説明または分析を可能に
  • オールインワン基盤モデル: BAGEL AI内で多様なマルチモーダルタスクのために単一の14B MoTベースのアーキテクチャを使用

BAGEL AIを使用すると、アーティスト、研究者、開発者は、BAGEL AIテクノロジーによって強化された統一された拡張可能なComfyUIインターフェースを使用して、マルチモーダルAIの生成および分析能力を探求できます。

1 - BAGEL AIによるテキストから画像生成

BAGEL AI

自然言語プロンプトを使用して画像を生成

BAGEL AIを使用すると、テキスト入力から直接高品質の画像を作成できます。BAGEL AIを始めるには:

  1. BAGEL AIのPrompt入力ノードに詳細なテキストプロンプトを入力します。
  2. 必要に応じて、BAGEL AI内でシード、アスペクト比、デコードステップなどのパラメータを設定します。
  3. BAGEL AIワークフローを実行してBAGELモデルから新しい画像を生成します。

このBAGEL AI機能は、コンセプトアート、ビジュアルアイディエーション、ストーリーテリング、または純粋に自然言語記述を使用した迅速なプロトタイピングに最適です。

2 - BAGEL AIによる画像理解とビジュアルQ&A

BAGEL AI

言語を使用して画像を分析および理解

BAGEL AIには高度なマルチモーダル推論と理解機能が含まれており、BAGEL AIは画像のキャプション付け、分析、およびQ&Aに最適です:

  1. BAGEL AIに分析する画像をアップロードします。
  2. BAGEL AIで画像についての質問またはプロンプトを入力します(例:「男性が持っているものは何ですか?」「このシーンを説明してください。」)。
  3. BAGEL AIシステムは、画像コンテンツに基づいてビジュアルな回答または推論のトレースを返します。
    このBAGEL AI機能は特に教育、コンテンツタグ付け、アクセシビリティワークフロー、またはBAGEL AI機能による視覚的な基盤を必要とするAIエージェントに役立ちます。

3 - BAGEL AIでのテキスト指示を使用した画像編集

BAGEL AI

プロンプトベースの編集で既存の画像を修正

BAGEL AIはまた、BAGEL AIの高度なインターフェースを通じてプロンプトベースの画像編集をサポートしています。BAGEL AIの使用方法:

  1. BAGEL AI入力ノードに元の画像をアップロードします。
  2. BAGEL AIで行いたい修正を説明するテキスト指示を提供します(例:「夕日を背景に追加」、「雪を降らせる」など)。
  3. ノードグループを実行して、BAGEL AI処理を使用して希望の編集を適用します。

これにより、アーティストやデザイナーは手動の写真編集を必要とせずに、シンプルなテキストを通じて画像を非破壊的に変換でき、すべてBAGEL AIテクノロジーによって強化されています。

謝辞

ComfyUIのためのBAGEL AIワークフローは、ByteDance SeedによるオープンソースのBAGEL-7B-MoTモデルに基づいています。
ComfyUI統合およびBAGEL AIワークフローのセットアップはneverbiasuによって開発され、統一されたBAGEL AIインターフェース内で画像生成、編集、および理解機能へのシームレスなアクセスを提供しています。

GitHubリポジトリ:

BAGEL AIモデル情報

  • モデル名: ComfyUI BAGEL-7B-MoT
  • アーキテクチャ: BAGEL AIのために最適化されたMixture-of-Transformer-Experts (MoT)
  • 総パラメータ数: BAGEL AIで14B(7Bアクティブ)
  • ComfyUIパス: models/bagel/ComfyUI-BAGEL-7B-MoT/
  • 自動ダウンロード: BAGEL AIで有効
  • 手動ダウンロード:

より多くのComfyUIワークフローが必要ですか?

RunComfy
著作権 2025 RunComfy. All Rights Reserved.

RunComfyは最高の ComfyUI プラットフォームです。次のものを提供しています: ComfyUIオンライン 環境とサービス、および ComfyUIワークフロー 魅力的なビジュアルが特徴です。 RunComfyはまた提供します AI Playground, アーティストが最新のAIツールを活用して素晴らしいアートを作成できるようにする。