Ideogram 4 ComfyUI ワークフロー | 構造化テキストから画像生成

Ideogram 4 ComfyUI workflow Workflow

Ideogram 4 ComfyUI workflow | Structured Text-to-Image Generator

Want to run this workflow?

Fully operational workflows
No missing nodes or models
No manual setups required
Features stunning visuals

Ideogram 4 ComfyUI workflow Examples

ideogram-4-comfyui-workflow-structured-text-to-image-generator-1443-example_01.webp

ideogram-4-comfyui-workflow-structured-text-to-image-generator-1443-example_02.webp

ideogram-4-comfyui-workflow-structured-text-to-image-generator-1443-example_03.webp

ideogram-4-comfyui-workflow-structured-text-to-image-generator-1443-example_04.webp

ideogram-4-comfyui-workflow-structured-text-to-image-generator-1443-example_05.webp

ideogram-4-comfyui-workflow-structured-text-to-image-generator-1443-example_06.webp

Ideogram 4 ComfyUI ワークフロー: レイアウトとタイポグラフィの精密な制御による構造化されたテキストから画像生成#

この Ideogram 4 ComfyUI ワークフローは、デザイン、レイアウト制御、信頼性の高い画像内テキストに特化して構築された、オープンウェイトのテキストから画像モデルである Ideogram 4.0 のためのコンパクトで RunComfy 対応のテンプレートです。構造化された JSON キャプションをシーンの概要、スタイルブロック、正規化されたバウンディングボックス、16進カラーパレットを使用して画像に変換します。ポスター、ブランドコンプ、タイポグラフィー重視のグラフィック、レイアウト意識のあるイラストに理想的です。

このグラフは、クリーンでシングルパスのテキストから画像へのパイプラインと、オプションのオングラフ JSON プロンプトビルダーを提供します。すでに JSON プロンプトを書いている場合は、それを貼り付けてすぐにレンダリングできます。短いアイデアから始める場合は、LLM ヘルパーがスキーマに準拠したキャプションを作成し、プレビューしてジェネレーターに貼り付けることができます。内部では、ワークフローは Ideogram 4 のフローマッチング DiT サンプリングと非対称のクラスフィアーフリーガイダンスに従います。

Comfyui Ideogram 4 ComfyUI ワークフローの主要モデル#

Ideogram 4 (FP8)。9.3B パラメータの Diffusion Transformer はフローマッチングでトレーニングされ、JSON ガイド付き生成、強力なテキストレンダリング、明示的なレイアウト制御を目的としています。公式モデルカード: ideogram-ai/ideogram-4-fp8。推論コード: ideogram-oss/ideogram4。
Ideogram 4 無条件ブランチ。非対称のクラスフィアーフリーガイダンス中に使用されるペアの無条件チェックポイント。ComfyUI と一緒にメインモデルとしてパッケージ化されています: Comfy-Org/Ideogram-4。
Qwen3‑VL‑8B‑Instruct (FP8)。プロンプトからのマルチスケールのセマンティックフィーチャーを提供するテキストエンコーダーとして使用されるビジョンラングエージエンコーダー: Qwen/Qwen3-VL-8B-Instruct-FP8 (ComfyUI のリパック: Comfy-Org/Qwen3-VL)。
FLUX.2 VAE。サンプルされた潜在変数を最終画像に変換するデコーダー。ComfyUI 用にパッケージ化されています: Comfy-Org/flux2-dev。

Comfyui Ideogram 4 ComfyUI ワークフローの使用方法#

全体のロジック: キャンバスを選択し、プロンプト（理想的には構造化された JSON）を提供し、サンプラープリセット（Default、Quality、Turbo）を選択してレンダリングします。メインの「Text to Image (Ideogram v4)」サブグラフは、エンコーディング、ガイダンス、サンプリング、デコーディングを一度に実行します。オプションの「LLM Prompt Builder」グループは JSON をあなたのために下書きできます。

キャンバスとアスペクト比: ResolutionSelector (#37)
- 1:1、16:9、9:16 などのプリセットを選択します。ワークフローは Ideogram 4 に適した有効な寸法（16 の倍数で妥当な最小値）を計算し、サンプラーと VAE に伝播させます。これにより、手動の計算なしで正方形のサムネイルから縦長のポスターまでターゲットにできます。いつでも変更可能で、スケジューラーは選択した解像度に適応します。
プロンプトと JSON キャプション: CLIP Text Encode (Positive Prompt) (#24)
- 自然言語を貼り付けるか、最良の結果を得るために Ideogram 4 のスキーマに従った構造化 JSON キャプションを使用してください。high_level_description、style_description ブロック（大文字の 16 進数としての color_palette を含む）、および compositional_deconstruction セクションを使用します。バウンディングボックスは 0–1000 グリッド上で正規化され、順序は [y_min, x_min, y_max, x_max] で左上を原点とします。画像にリテラルテキストをレンダリングするために type: "text" アイテムを含めます。モデルはキーの順序に敏感です。公式ガイドは docs/prompting.md を参照してください。
プリセットモード（速度対品質）: サブグラフ内の「Preset」グループ
- サブグラフの mode 入力でモードを選択します: Default（バランス）、Quality（ステップ数と忠実度が多い）、または Turbo（ステップ数が少なく最速のフィードバック）。ワークフローは小さな内部プリセットテーブルを解析し、一致するステップ数とスケジュールパラメータをスケジューラーにルーティングします。プリセットを切り替えて迅速に反復し、その後より高い品質で仕上げます。
サンプリングとガイダンス: サブグラフ内の「Sampling」グループ
- パイプラインは非対称のクラスフィアーフリーガイダンス用にペアの無条件ブランチを使用したフローマッチングサンプリングを使用します。DualModelGuider は条件付きおよび無条件の予測をブレンドし、Ideogram4Scheduler は選択したサイズとプリセットに対するノイズスケジュールを形成します。KSamplerSelect はアルゴリズムを選択し、SamplerCustomAdvanced はデコーディングの前にデノイズパスを実行します。
モデル（事前配線済み）: サブグラフ内の「Models」グループ
- グラフはメインの Ideogram 4 モデル、その無条件のパートナー、Qwen3‑VL テキストエンコーダー、および FLUX.2 VAE をロードします。これらはガイダー、サンプラー、およびデコーダーに配線されています。通常はこれらを変更する必要はありませんが、ComfyUI 用にパッケージ化されたバリエーションで実験している場合はモデルを交換することが可能です。
オプション: オングラフ JSON ドラフティング: JSON Prompt Builder (Gemma4) (#134)
- 「LLM Prompt Builder (Select and Ctrl+B to enable)」グループを選択してオンにします。user_prompt フィールドに短いアイデアを入力すると、ノードがスキーマに準拠した JSON キャプションを下書きし、PreviewAny (#111) でプレビューできます。生成された JSON をメインの prompt 入力にコピーして画像サブグラフに使用します。
出力: SaveImage (#158)
- 画像はモデルバージョンの名前を付けたフォルダーに書き込まれます。異なるプリセットまたはアスペクト比からの出力を分けて保持する場合は、プレフィックスを変更してください。

Comfyui Ideogram 4 ComfyUI ワークフローの主要ノード#

CLIP Text Encode (Positive Prompt) (#24)
- Ideogram 4 用に Qwen3‑VL でプロンプトをエンコードします。レイアウト制御、画像内テキスト、パレットステアリングを明示するために構造化 JSON を使用します。キーの順序を安定させ、bbox エントリーには 0–1000 グリッド上の値を使用します。これはモデルの文書化されたスキーマに一致します。docs/prompting.md を参照してください。
UNETLoader (#23)
- 条件付きデノイズを実行するメインの Ideogram 4 チェックポイントをロードします。これはエンコードされたキャプションを画像に変換するバックボーンです。最も一貫性のある結果を得るためには公式リリースとしてそのままにしてください: ideogram-ai/ideogram-4-fp8。
UNETLoader (#154)
- 非対称のクラスフィアーフリーガイダンスに使用される無条件の Ideogram 4 チェックポイントをロードします。これをメインモデルとペアリングすることで、ガイダーはプロンプトの忠実性と全体的な画像品質を別々に制御できます: Comfy-Org/Ideogram-4。
DualModelGuider (#155)
- 条件付きおよび無条件の予測を結合して非対称のクラスフィアーフリーガイダンスを実装します。ガイダンスの強さを調整するのは、トレードオフを理解している場合のみです: 少なすぎるとプロンプトの忠実性が弱まり、過剰だと過度にシャープ化や歪みが発生する可能性があります。プリセットを変更する際には、同様の「感触」を維持するためにガイダンスを見直してください。
Ideogram4Scheduler (#17)
- 選択した幅と高さに特化したノイズスケジュールとステップ数を生成します。「Preset」グループは一致するステップとスケジュールパラメータを供給します。最終レンダリングには Quality、ドラフトには Turbo、日常の作業には Default を使用します。
SamplerCustomAdvanced (#12)
- 選択したサンプラーを使用し、スケジューラーの sigmas を用いてデノイズパスを実行します。意図的にサンプラーファミリーを比較しているのでない限り、これを変更しないでください。サンプラーを交換する場合は、解像度とプリセットを固定して A/B テストを意味のあるものにしてください。
CFGOverride (#157)
- サンプリング中に適用される条件付けの微調整を可能にします。ほとんどのユーザーはこれを無視してプリセットに頼ることができます。調整する場合は小さな変更を加え、複数のプロンプトで再評価して、サンプラーの動作を単一のシーンに過度に適合させないようにしてください。
VAELoader (#9) および VAEDecode (#13)
- FLUX.2 VAE をロードし、サンプルされた潜在変数を最終画像にデコードします。公式の VAE を保持して、カラーリメトリーとディテールバランスを維持してください。代替品をテストしている場合を除きます: Comfy-Org/flux2-dev。

オプションの追加機能#

JSON 内の type: "text" 要素を使用して、画像内に正確な言葉をレンダリングします。文字列を簡潔に保ち、専用の bbox で配置してください。
初めに style_description.color_palette に 3～6 色（大文字の 16 進数）を使用し、局所的なオーバーライドが必要な場合にのみ要素ごとのパレットを追加します。
レイアウトでは三分割を考慮してください: bbox のサイズと位置を変えて奥行きを作り、重ならないボックスで衝突を減らします。
ノイズシードを固定してコンポジションを再現します。JSON を変更せずにバリエーションを探索するために変更してください。
「Image blocked by safety filter」というメッセージが表示された場合は、その応答はモデル自体から来ています。安全でスキーマに準拠したプロンプトに向けてコンテンツを調整してください。詳細については、モデルカードをご覧ください: ideogram-ai/ideogram-4-fp8。

謝辞#

このワークフローは以下の作品とリソースを実装し、それらに基づいて構築されています。Comfy-Org の ComfyUI Day 0 サポート発表と Ideogram 4 用のワークフローテンプレート、Comfy-Org の Ideogram-4 モデルカード、ideogram-oss のIdeogram 4 推論コードリポジトリに感謝の意を表します。権威ある詳細については、以下にリンクされたオリジナルのドキュメントとリポジトリを参照してください。

リソース#

Comfy-Org/Comfy ブログ発表
- ドキュメント / リリースノート: Ideogram 4 Day 0 support in ComfyUI
Comfy-Org/Comfy ワークフローテンプレート
- GitHub: Comfy-Org/workflow_templates — image_ideogram4_t2i.json
Comfy-Org/Ideogram 4 ComfyUI モデルカード
- Hugging Face: Comfy-Org/Ideogram-4
ideogram-oss/Ideogram 4 推論コードリポジトリ
- GitHub: ideogram-oss/ideogram4

注: 参照されているモデル、データセット、コードの使用は、それぞれjson

の著者とメンテナーによって提供されるライセンスおよび条件に従います。

Want More ComfyUI Workflows?

Qwen-Image | HD マルチテキストポスタージェネレーター

画像におけるテキスト生成の新時代！

Qwen-Image Lightning | 8ステップスピードブースト

生成時間を半分に短縮。

Omost | 画像作成を強化

OmostはLLMコーディングを使用して正確で高品質な画像を生成します。

ERNIE-Image ComfyUI | スマートテキストから画像へのジェネレーター

言葉を瞬時に正確で詳細なビジュアルに変換します。

IPAdapter Plus（V2）| 画像のマージ

IPAdapter Plusのさまざまなマージ方法を使用して、正確で効率的な画像ブレンディング制御を実現します。

Qwen画像編集 | 正確なAI写真編集

スタイル、再照明、オブジェクト制御の精度で写真を迅速に編集します。

Face to Many | 3D, Emoji, Pixel, Clay, Toy, Video game

LoRAモデル、ControlNet、InstantIDを利用した高度な顔の多様な変換

MV-Adapter | 高解像度マルチビュージェネレーター

単一の画像や説明からあらゆるものの360度ビューを生成します。

フォローする

サポート

リソース

法的情報

RunComfy

RunComfyは最高の ComfyUI プラットフォームです。次のものを提供しています: ComfyUIオンライン環境とサービス、および ComfyUIワークフロー魅力的なビジュアルが特徴です。 RunComfyはまた提供します AI Models, アーティストが最新のAIツールを活用して素晴らしいアートを作成できるようにする。

Ideogram 4 ComfyUI ワークフロー | テキストから画像へのレイアウト生成