Ideogram 4 ComfyUI ワークフロー: レイアウトとタイポグラフィの精密な制御による構造化されたテキストから画像生成#
この Ideogram 4 ComfyUI ワークフローは、デザイン、レイアウト制御、信頼性の高い画像内テキストに特化して構築された、オープンウェイトのテキストから画像モデルである Ideogram 4.0 のためのコンパクトで RunComfy 対応のテンプレートです。構造化された JSON キャプションをシーンの概要、スタイルブロック、正規化されたバウンディングボックス、16進カラーパレットを使用して画像に変換します。ポスター、ブランドコンプ、タイポグラフィー重視のグラフィック、レイアウト意識のあるイラストに理想的です。
このグラフは、クリーンでシングルパスのテキストから画像へのパイプラインと、オプションのオングラフ JSON プロンプトビルダーを提供します。すでに JSON プロンプトを書いている場合は、それを貼り付けてすぐにレンダリングできます。短いアイデアから始める場合は、LLM ヘルパーがスキーマに準拠したキャプションを作成し、プレビューしてジェネレーターに貼り付けることができます。内部では、ワークフローは Ideogram 4 のフローマッチング DiT サンプリングと非対称のクラスフィアーフリーガイダンスに従います。
Comfyui Ideogram 4 ComfyUI ワークフローの主要モデル#
- Ideogram 4 (FP8)。9.3B パラメータの Diffusion Transformer はフローマッチングでトレーニングされ、JSON ガイド付き生成、強力なテキストレンダリング、明示的なレイアウト制御を目的としています。公式モデルカード: ideogram-ai/ideogram-4-fp8。推論コード: ideogram-oss/ideogram4。
- Ideogram 4 無条件ブランチ。非対称のクラスフィアーフリーガイダンス中に使用されるペアの無条件チェックポイント。ComfyUI と一緒にメインモデルとしてパッケージ化されています: Comfy-Org/Ideogram-4。
- Qwen3‑VL‑8B‑Instruct (FP8)。プロンプトからのマルチスケールのセマンティックフィーチャーを提供するテキストエンコーダーとして使用されるビジョンラングエージエンコーダー: Qwen/Qwen3-VL-8B-Instruct-FP8 (ComfyUI のリパック: Comfy-Org/Qwen3-VL)。
- FLUX.2 VAE。サンプルされた潜在変数を最終画像に変換するデコーダー。ComfyUI 用にパッケージ化されています: Comfy-Org/flux2-dev。
Comfyui Ideogram 4 ComfyUI ワークフローの使用方法#
全体のロジック: キャンバスを選択し、プロンプト(理想的には構造化された JSON)を提供し、サンプラープリセット(Default、Quality、Turbo)を選択してレンダリングします。メインの「Text to Image (Ideogram v4)」サブグラフは、エンコーディング、ガイダンス、サンプリング、デコーディングを一度に実行します。オプションの「LLM Prompt Builder」グループは JSON をあなたのために下書きできます。
- キャンバスとアスペクト比:
ResolutionSelector(#37)- 1:1、16:9、9:16 などのプリセットを選択します。ワークフローは Ideogram 4 に適した有効な寸法(16 の倍数で妥当な最小値)を計算し、サンプラーと VAE に伝播させます。これにより、手動の計算なしで正方形のサムネイルから縦長のポスターまでターゲットにできます。いつでも変更可能で、スケジューラーは選択した解像度に適応します。
- プロンプトと JSON キャプション:
CLIP Text Encode (Positive Prompt)(#24)- 自然言語を貼り付けるか、最良の結果を得るために Ideogram 4 のスキーマに従った構造化 JSON キャプションを使用してください。
high_level_description、style_descriptionブロック(大文字の 16 進数としてのcolor_paletteを含む)、およびcompositional_deconstructionセクションを使用します。バウンディングボックスは 0–1000 グリッド上で正規化され、順序は[y_min, x_min, y_max, x_max]で左上を原点とします。画像にリテラルテキストをレンダリングするためにtype: "text"アイテムを含めます。モデルはキーの順序に敏感です。公式ガイドは docs/prompting.md を参照してください。
- 自然言語を貼り付けるか、最良の結果を得るために Ideogram 4 のスキーマに従った構造化 JSON キャプションを使用してください。
- プリセットモード(速度対品質): サブグラフ内の「Preset」グループ
- サブグラフの
mode入力でモードを選択します: Default(バランス)、Quality(ステップ数と忠実度が多い)、または Turbo(ステップ数が少なく最速のフィードバック)。ワークフローは小さな内部プリセットテーブルを解析し、一致するステップ数とスケジュールパラメータをスケジューラーにルーティングします。プリセットを切り替えて迅速に反復し、その後より高い品質で仕上げます。
- サブグラフの
- サンプリングとガイダンス: サブグラフ内の「Sampling」グループ
- パイプラインは非対称のクラスフィアーフリーガイダンス用にペアの無条件ブランチを使用したフローマッチングサンプリングを使用します。
DualModelGuiderは条件付きおよび無条件の予測をブレンドし、Ideogram4Schedulerは選択したサイズとプリセットに対するノイズスケジュールを形成します。KSamplerSelectはアルゴリズムを選択し、SamplerCustomAdvancedはデコーディングの前にデノイズパスを実行します。
- パイプラインは非対称のクラスフィアーフリーガイダンス用にペアの無条件ブランチを使用したフローマッチングサンプリングを使用します。
- モデル(事前配線済み): サブグラフ内の「Models」グループ
- グラフはメインの Ideogram 4 モデル、その無条件のパートナー、Qwen3‑VL テキストエンコーダー、および FLUX.2 VAE をロードします。これらはガイダー、サンプラー、およびデコーダーに配線されています。通常はこれらを変更する必要はありませんが、ComfyUI 用にパッケージ化されたバリエーションで実験している場合はモデルを交換することが可能です。
- オプション: オングラフ JSON ドラフティング:
JSON Prompt Builder (Gemma4)(#134)- 「LLM Prompt Builder (Select and Ctrl+B to enable)」グループを選択してオンにします。
user_promptフィールドに短いアイデアを入力すると、ノードがスキーマに準拠した JSON キャプションを下書きし、PreviewAny(#111) でプレビューできます。生成された JSON をメインのprompt入力にコピーして画像サブグラフに使用します。
- 「LLM Prompt Builder (Select and Ctrl+B to enable)」グループを選択してオンにします。
- 出力:
SaveImage(#158)- 画像はモデルバージョンの名前を付けたフォルダーに書き込まれます。異なるプリセットまたはアスペクト比からの出力を分けて保持する場合は、プレフィックスを変更してください。
Comfyui Ideogram 4 ComfyUI ワークフローの主要ノード#
CLIP Text Encode (Positive Prompt)(#24)- Ideogram 4 用に Qwen3‑VL でプロンプトをエンコードします。レイアウト制御、画像内テキスト、パレットステアリングを明示するために構造化 JSON を使用します。キーの順序を安定させ、
bboxエントリーには 0–1000 グリッド上の値を使用します。これはモデルの文書化されたスキーマに一致します。docs/prompting.md を参照してください。
- Ideogram 4 用に Qwen3‑VL でプロンプトをエンコードします。レイアウト制御、画像内テキスト、パレットステアリングを明示するために構造化 JSON を使用します。キーの順序を安定させ、
UNETLoader(#23)- 条件付きデノイズを実行するメインの Ideogram 4 チェックポイントをロードします。これはエンコードされたキャプションを画像に変換するバックボーンです。最も一貫性のある結果を得るためには公式リリースとしてそのままにしてください: ideogram-ai/ideogram-4-fp8。
UNETLoader(#154)- 非対称のクラスフィアーフリーガイダンスに使用される無条件の Ideogram 4 チェックポイントをロードします。これをメインモデルとペアリングすることで、ガイダーはプロンプトの忠実性と全体的な画像品質を別々に制御できます: Comfy-Org/Ideogram-4。
DualModelGuider(#155)- 条件付きおよび無条件の予測を結合して非対称のクラスフィアーフリーガイダンスを実装します。ガイダンスの強さを調整するのは、トレードオフを理解している場合のみです: 少なすぎるとプロンプトの忠実性が弱まり、過剰だと過度にシャープ化や歪みが発生する可能性があります。プリセットを変更する際には、同様の「感触」を維持するためにガイダンスを見直してください。
Ideogram4Scheduler(#17)- 選択した幅と高さに特化したノイズスケジュールとステップ数を生成します。「Preset」グループは一致するステップとスケジュールパラメータを供給します。最終レンダリングには Quality、ドラフトには Turbo、日常の作業には Default を使用します。
SamplerCustomAdvanced(#12)- 選択したサンプラーを使用し、スケジューラーの
sigmasを用いてデノイズパスを実行します。意図的にサンプラーファミリーを比較しているのでない限り、これを変更しないでください。サンプラーを交換する場合は、解像度とプリセットを固定して A/B テストを意味のあるものにしてください。
- 選択したサンプラーを使用し、スケジューラーの
CFGOverride(#157)- サンプリング中に適用される条件付けの微調整を可能にします。ほとんどのユーザーはこれを無視してプリセットに頼ることができます。調整する場合は小さな変更を加え、複数のプロンプトで再評価して、サンプラーの動作を単一のシーンに過度に適合させないようにしてください。
VAELoader(#9) およびVAEDecode(#13)- FLUX.2 VAE をロードし、サンプルされた潜在変数を最終画像にデコードします。公式の VAE を保持して、カラーリメトリーとディテールバランスを維持してください。代替品をテストしている場合を除きます: Comfy-Org/flux2-dev。
オプションの追加機能#
- JSON 内の
type: "text"要素を使用して、画像内に正確な言葉をレンダリングします。文字列を簡潔に保ち、専用のbboxで配置してください。 - 初めに
style_description.color_paletteに 3~6 色(大文字の 16 進数)を使用し、局所的なオーバーライドが必要な場合にのみ要素ごとのパレットを追加します。 - レイアウトでは三分割を考慮してください:
bboxのサイズと位置を変えて奥行きを作り、重ならないボックスで衝突を減らします。 - ノイズシードを固定してコンポジションを再現します。JSON を変更せずにバリエーションを探索するために変更してください。
- 「Image blocked by safety filter」というメッセージが表示された場合は、その応答はモデル自体から来ています。安全でスキーマに準拠したプロンプトに向けてコンテンツを調整してください。詳細については、モデルカードをご覧ください: ideogram-ai/ideogram-4-fp8。
謝辞#
このワークフローは以下の作品とリソースを実装し、それらに基づいて構築されています。Comfy-Org の ComfyUI Day 0 サポート発表と Ideogram 4 用のワークフローテンプレート、Comfy-Org の Ideogram-4 モデルカード、ideogram-oss のIdeogram 4 推論コードリポジトリに感謝の意を表します。権威ある詳細については、以下にリンクされたオリジナルのドキュメントとリポジトリを参照してください。
リソース#
- Comfy-Org/Comfy ブログ発表
- ドキュメント / リリースノート: Ideogram 4 Day 0 support in ComfyUI
- Comfy-Org/Comfy ワークフローテンプレート
- Comfy-Org/Ideogram 4 ComfyUI モデルカード
- Hugging Face: Comfy-Org/Ideogram-4
- ideogram-oss/Ideogram 4 推論コードリポジトリ
- GitHub: ideogram-oss/ideogram4
注: 参照されているモデル、データセット、コードの使用は、それぞれjson
の著者とメンテナーによって提供されるライセンスおよび条件に従います。









