Ideogram 4 ComfyUI 工作流程 | 結構化文本到圖像生成器

Ideogram 4 ComfyUI workflow Workflow

Ideogram 4 ComfyUI workflow | Structured Text-to-Image Generator

Want to run this workflow?

Fully operational workflows
No missing nodes or models
No manual setups required
Features stunning visuals

Ideogram 4 ComfyUI workflow Examples

ideogram-4-comfyui-workflow-structured-text-to-image-generator-1443-example_01.webp

ideogram-4-comfyui-workflow-structured-text-to-image-generator-1443-example_02.webp

ideogram-4-comfyui-workflow-structured-text-to-image-generator-1443-example_03.webp

ideogram-4-comfyui-workflow-structured-text-to-image-generator-1443-example_04.webp

ideogram-4-comfyui-workflow-structured-text-to-image-generator-1443-example_05.webp

ideogram-4-comfyui-workflow-structured-text-to-image-generator-1443-example_06.webp

Ideogram 4 ComfyUI 工作流程：精確佈局和排版的結構化文本到圖像#

這個 Ideogram 4 ComfyUI 工作流程是一個緊湊的、RunComfy-ready 模板，用於 Ideogram 4.0，一個開放權重的文本到圖像模型，專為設計、佈局控制和可靠的圖像內文本而構建。它將結構化的 JSON 標題轉換為帶有場景摘要、樣式塊、標準化邊界框和十六進制色彩調色盤的圖像，非常適合海報、品牌合成、排版重的圖形和佈局感知插圖。

該圖表提供了一個乾淨的、單一路徑的文本到圖像管道，外加一個可選的圖上 JSON 提示生成器。如果您已經編寫 JSON 提示，請粘貼並立即渲染；如果您希望從一個簡短的想法開始，LLM 助手可以起草一個符合架構的標題，您可以預覽並粘貼到生成器中。在底層，工作流程遵循 Ideogram 4 的流匹配 DiT 取樣，帶有不對稱的無分類器指導。

Comfyui Ideogram 4 ComfyUI 工作流程中的關鍵模型#

Ideogram 4 (FP8)。擁有 9.3B 參數的 Diffusion Transformer，通過流匹配訓練，專為 JSON 引導生成、強大的文本渲染和明確的佈局控制而設計。官方模型卡：ideogram-ai/ideogram-4-fp8。推理代碼：ideogram-oss/ideogram4。
Ideogram 4 無條件分支。用於取樣時不對稱的無分類器指導的配對無條件檢查點；與主模型一起打包給 ComfyUI：Comfy-Org/Ideogram-4。
Qwen3-VL-8B-Instruct (FP8)。作為文本編碼器使用的視覺語言編碼器，從提示中提供多尺度語義特徵：Qwen/Qwen3-VL-8B-Instruct-FP8 (ComfyUI repack: Comfy-Org/Qwen3-VL)。
FLUX.2 VAE。用於將取樣的潛在變量轉換為最終圖像的解碼器，為 ComfyUI 打包：Comfy-Org/flux2-dev。

如何使用 Comfyui Ideogram 4 ComfyUI 工作流程#

整體邏輯：選擇畫布，提供提示（最好是結構化 JSON），選擇采樣器預設（默認、質量、Turbo），然後渲染。主“文本到圖像（Ideogram v4）”子圖執行編碼、指導、取樣和解碼一氣呵成；可選的“LLM 提示生成器”組可以為您起草 JSON。

畫布和縱橫比：ResolutionSelector (#37)
- 選擇如 1:1、16:9 或 9:16 的預設。工作流程計算 Ideogram 4 的有效尺寸（16 的倍數並具有合理的最小值）並將其傳播到采樣器和 VAE。這讓您可以針對從方形縮略圖到高海報的一切，而不需要手動計算。隨時更改；調度器會適應您選擇的分辨率。
提示和 JSON 標題：CLIP Text Encode (Positive Prompt) (#24)
- 粘貼自然語言或為獲得最佳效果，遵循 Ideogram 4 的架構使用結構化 JSON 標題。使用 high_level_description、style_description 塊（用大寫十六進制代碼的 color_palette）和 compositional_deconstruction 部分。邊界框在 0–1000 網格上標準化，順序為 [y_min, x_min, y_max, x_max]，原點在左上角；包括 type: "text" 項目以在圖像中渲染文字。模型對鍵順序敏感；請參見官方指南 docs/prompting.md。
預設模式（速度與質量）：子圖內的“Preset”組
- 在子圖的 mode 輸入中選擇一個模式：默認（平衡）、質量（更多步驟和保真度）或 Turbo（較少步驟和最快反饋）。工作流程解析一個小的內部預設表，並將匹配的步驟計數和調度參數路由到調度器。切換預設以快速迭代，然後以更高質量完成。
取樣和指導：子圖內的“Sampling”組
- 管道使用流匹配取樣，帶有配對的無條件分支以進行不對稱的無分類器指導。DualModelGuider 混合條件和無條件預測，而 Ideogram4Scheduler 為您選擇的大小和預設塑造噪聲調度。KSamplerSelect 選擇算法，SamplerCustomAdvanced 在解碼前運行去噪過程。
模型（預接線）：子圖內的“Models”組
- 圖表加載了主 Ideogram 4 模型，其無條件合作伙伴，Qwen3-VL 文本編碼器和 FLUX.2 VAE。這些被接入指導器、采樣器和解碼器。通常不需要更改這些，但如果您正在嘗試 ComfyUI 打包的變體，則可以更換模型。
可選：圖上 JSON 起草：JSON Prompt Builder (Gemma4) (#134)
- 選擇“LLM 提示生成器（選擇並按 Ctrl+B 啟用）”組以將其打開。在 user_prompt 字段中輸入一個簡短的想法；該節點草擬一個符合架構的 JSON 標題，您可以使用 PreviewAny (#111) 預覽。將生成的 JSON 複製到圖像子圖的主 prompt 輸入中。
輸出：SaveImage (#158)
- 圖像寫入一個以模型版本命名的文件夾中。如果您希望將不同預設或縱橫比的輸出分開，請重命名前綴。

Comfyui Ideogram 4 ComfyUI 工作流程中的關鍵節點#

CLIP Text Encode (Positive Prompt) (#24)
- 使用 Qwen3-VL 為 Ideogram 4 編碼提示。使用結構化 JSON 進行佈局控制、明確的圖像內文本和調色盤引導。保持鍵順序穩定，並對 bbox 條目使用 0–1000 網格上的值 [y_min, x_min, y_max, x_max]；這符合模型在 docs/prompting.md 中的文檔化架構。
UNETLoader (#23)
- 加載執行條件去噪的主 Ideogram 4 檢查點。這是將您的編碼標題轉換為圖像的骨幹；將其保持為官方發布以獲得最一致的效果：ideogram-ai/ideogram-4-fp8。
UNETLoader (#154)
- 加載用於不對稱無分類器指導的無條件 Ideogram 4 檢查點。將此與主模型配對，讓指導器分別控制提示遵從性和整體圖像質量：Comfy-Org/Ideogram-4。
DualModelGuider (#155)
- 結合條件和無條件預測以實現不對稱無分類器指導。僅在您了解權衡時調整指導力度：太少會削弱提示保真度；太多可能會過度銳化或扭曲。更改預設時，重新訪問指導以保持類似的“感覺”。
Ideogram4Scheduler (#17)
- 生成專為 Ideogram 4 設計的噪聲調度和步驟計數，根據您選擇的寬度和高度。"Preset" 組將匹配的步驟和調度參數傳遞給它；使用 Quality 進行最終渲染，Turbo 進行草稿，Default 用於日常工作。
SamplerCustomAdvanced (#12)
- 使用選擇的采樣器和調度器的 sigmas 運行去噪過程。除非您有意比較采樣器家族，否則保持不變；如果您確實更換采樣器，請保持分辨率和預設固定以使 A/B 有意義。
CFGOverride (#157)
- 在采樣期間提供對如何應用條件的精細控制。大多數用戶可以忽略此功能並依賴預設；如果您進行調整，請進行小幅更改並在多個提示上重新評估以避免過度擬合采樣器行為到單一場景。
VAELoader (#9) 和 VAEDecode (#13)
- 加載並應用 FLUX.2 VAE 將取樣的潛在變量解碼為最終圖像。保持官方 VAE 以保留色彩計量和細節平衡，除非您正在測試替代方案：Comfy-Org/flux2-dev。

可選附加功能#

在您的 JSON 中使用 type: "text" 元素以在圖像中渲染精確的文字；保持字符串簡潔並用專用 bbox 放置它們。
開始時在 style_description.color_palette 中使用 3–6 種顏色（大寫十六進制），只有在需要局部覆蓋時才添加每個元素的調色板。
對於佈局，考慮三分法：變化 bbox 大小和位置以創造深度；不重疊的框減少碰撞。
鎖定噪聲種子以重現組合；更改它以探索變化而不改變您的 JSON。
如果您看到“Image blocked by safety filter”，該響應來自模型本身；調整內容以符合安全的、架構一致的提示。完整詳情請參見模型卡：ideogram-ai/ideogram-4-fp8。

致謝#

此工作流程實現並建立在以下作品和資源之上。我們感謝 Comfy-Org 的 ComfyUI Day 0 支持公告和 Ideogram 4 的工作流程模板，Comfy-Org 的 Ideogram-4 模型卡以及 ideogram-oss 的Ideogram 4 推理程式碼存儲庫對其貢獻和維護。欲獲取權威細節，請參考下列原始文檔和存儲庫。

資源#

Comfy-Org/Comfy 博客公告
- Docs / Release Notes: Ideogram 4 Day 0 support in ComfyUI
Comfy-Org/Comfy 工作流程模板
- GitHub: Comfy-Org/workflow_templates — image_ideogram4_t2i.json
Comfy-Org/Ideogram 4 ComfyUI 模型卡
- Hugging Face: Comfy-Org/Ideogram-4
ideogram-oss/Ideogram 4 推理程式碼存儲庫
- GitHub: ideogram-oss/ideogram4