Ideogram 4 ComfyUI 工作流程 | 结构化文本到图像生成器

Ideogram 4 ComfyUI workflow Workflow

Ideogram 4 ComfyUI workflow | Structured Text-to-Image Generator

Want to run this workflow?

Fully operational workflows
No missing nodes or models
No manual setups required
Features stunning visuals

Ideogram 4 ComfyUI workflow Examples

ideogram-4-comfyui-workflow-structured-text-to-image-generator-1443-example_01.webp

ideogram-4-comfyui-workflow-structured-text-to-image-generator-1443-example_02.webp

ideogram-4-comfyui-workflow-structured-text-to-image-generator-1443-example_03.webp

ideogram-4-comfyui-workflow-structured-text-to-image-generator-1443-example_04.webp

ideogram-4-comfyui-workflow-structured-text-to-image-generator-1443-example_05.webp

ideogram-4-comfyui-workflow-structured-text-to-image-generator-1443-example_06.webp

Ideogram 4 ComfyUI 工作流程：具有精确布局和排版的结构化文本到图像#

这个 Ideogram 4 ComfyUI 工作流程是一个紧凑的、适合 RunComfy 的 Ideogram 4.0 模板，一个用于设计、布局控制和可靠的图像内文本的开放权重文本到图像模型。它将结构化的 JSON 标题转换为包含场景摘要、风格块、标准化边界框和十六进制调色板的图像，非常适合海报、品牌组合、排版密集的图形和布局感知插图。

此图提供了干净的单路径文本到图像管道，以及一个可选的图上 JSON 提示构建器。如果您已经编写 JSON 提示，直接粘贴并立即渲染；如果您更喜欢从一个简短的想法开始，LLM 助手可以起草一个符合模式的标题，您可以预览并粘贴到生成器中。在后台，工作流程遵循 Ideogram 4 的流匹配 DiT 采样，具有不对称的无分类器指导。

Comfyui Ideogram 4 ComfyUI 工作流程中的关键模型#

Ideogram 4 (FP8)。拥有 9.3B 参数的扩散变压器，使用流匹配训练，设计用于 JSON 引导生成、强大的文本渲染和明确的布局控制。官方模型卡：ideogram-ai/ideogram-4-fp8。推理代码：ideogram-oss/ideogram4。
Ideogram 4 无条件分支。用于采样期间不对称无分类器指导的配对无条件检查点；与主模型一起打包用于 ComfyUI：Comfy-Org/Ideogram-4。
Qwen3‑VL‑8B‑Instruct (FP8)。用作文本编码器的视觉语言编码器，从提示中提供多尺度语义特征：Qwen/Qwen3-VL-8B-Instruct-FP8 (ComfyUI 重包：Comfy-Org/Qwen3-VL)。
FLUX.2 VAE。用于将采样的潜在变量转换为最终图像的解码器，为 ComfyUI 打包：Comfy-Org/flux2-dev。

如何使用 Comfyui Ideogram 4 ComfyUI 工作流程#

总体逻辑：选择画布，提供提示（最好是结构化 JSON），选择采样器预设（Default, Quality, Turbo），然后渲染。主要的“文本到图像 (Ideogram v4)”子图在一个步骤中执行编码、指导、采样和解码；可选的“LLM 提示构建器”组可以为您起草 JSON。

画布和纵横比：ResolutionSelector (#37)
- 选择预设，如 1:1, 16:9 或 9:16。工作流程计算出适用于 Ideogram 4 的有效尺寸（16 的倍数，具有合理的最小值），并将其传播到采样器和 VAE。这让您可以从方形缩略图到高海报的所有目标，而无需手动计算。随时更改；调度器会适应您选择的分辨率。
提示和 JSON 标题：CLIP Text Encode (Positive Prompt) (#24)
- 粘贴自然语言或，为获得最佳效果，遵循 Ideogram 4 模式的结构化 JSON 标题。使用 high_level_description、style_description 块（使用大写十六进制代码的 color_palette）和 compositional_deconstruction 部分。边界框在 0–1000 网格上标准化，顺序为 [y_min, x_min, y_max, x_max]，原点在左上角；包括 type: "text" 项以在图像中渲染文字。模型对键顺序敏感；请参阅 docs/prompting.md 中的官方指南。
预设模式（速度与质量）：子图中的“Preset”组
- 在子图的 mode 输入中选择一种模式：Default（平衡），Quality（更多步骤和保真度），或 Turbo（更少步骤和最快反馈）。工作流程解析一个小的内部预设表并将匹配的步数和调度参数传递给调度器。切换预设以快速迭代，然后在更高质量下完成。
采样和指导：子图中的“Sampling”组
- 管道使用流匹配采样，搭配无条件分支用于不对称无分类器指导。DualModelGuider 混合条件和无条件预测，而 Ideogram4Scheduler 为您选择的尺寸和预设塑造噪声时间表。KSamplerSelect 选择算法，而 SamplerCustomAdvanced 在解码前运行去噪步骤。
模型（预接线）：子图中的“Models”组
- 图加载了主要的 Ideogram 4 模型、其无条件伙伴、Qwen3‑VL 文本编码器和 FLUX.2 VAE。这些被接入指导器、采样器和解码器。通常您不需要更改这些，但如果您在 ComfyUI 中测试变体，可以更换模型。
可选：图上 JSON 草稿：JSON Prompt Builder (Gemma4) (#134)
- 选择“LLM Prompt Builder (Select and Ctrl+B to enable)”组以启用。输入一个简短的想法在 user_prompt 字段中；节点起草一个符合模式的 JSON 标题，您可以使用 PreviewAny (#111) 预览。将生成的 JSON 复制到图像子图的主要 prompt 输入中。
输出：SaveImage (#158)
- 图像写入以模型版本命名的文件夹中。重命名前缀，如果您希望将来自不同预设或纵横比的输出分开保存。

Comfyui Ideogram 4 ComfyUI 工作流程中的关键节点#

CLIP Text Encode (Positive Prompt) (#24)
- 使用 Qwen3‑VL 为 Ideogram 4 编码提示。使用结构化 JSON 进行布局控制、明确的图像内文本和调色板引导。保持键顺序稳定，并使用 0–1000 网格上的值 [y_min, x_min, y_max, x_max] 作为 bbox 条目；这符合模型的 docs/prompting.md 中的文档化模式。
UNETLoader (#23)
- 加载执行条件去噪的主要 Ideogram 4 检查点。这是将您的编码标题转换为图像的骨干；保持官方发布以获得最一致的结果：ideogram-ai/ideogram-4-fp8。
UNETLoader (#154)
- 加载用于不对称无分类器指导的无条件 Ideogram 4 检查点。将此与主模型配对，使指导器能够分别控制提示遵从性和整体图像质量：Comfy-Org/Ideogram-4。
DualModelGuider (#155)
- 结合条件和无条件预测以实现不对称无分类器指导。只有在了解权衡的情况下才调整指导强度：太少会减弱提示保真度；太多可能会使图像过度锐化或失真。更改预设时，重新审视指导以保持类似的“感觉”。
Ideogram4Scheduler (#17)
- 为您选择的宽度和高度生成专门用于 Ideogram 4 的噪声计划和步数。“Preset”组为其提供匹配的步骤和时间表参数；使用 Quality 进行最终渲染，使用 Turbo 进行草稿，使用 Default 进行日常工作。
SamplerCustomAdvanced (#12)
- 使用选定的采样器和调度器的 sigmas 运行去噪步骤。除非您有意比较采样器系列，否则保持不变；如果您确实更换采样器，请保持分辨率和预设不变，以使 A/B 对比有意义。
CFGOverride (#157)
- 提供采样期间如何应用条件的细粒度控制旋钮。大多数用户可以忽略此项并依赖于预设；如果您调整它，请进行小幅更改并在多个提示上重新评估，以避免过度拟合采样器行为到单个场景。
VAELoader (#9) 和 VAEDecode (#13)
- 加载并应用 FLUX.2 VAE 以解码采样的潜在变量为最终图像。保持官方 VAE 以保留色彩和细节平衡，除非您在测试替代品：Comfy-Org/flux2-dev。

可选额外功能#

在 JSON 中使用 type: "text" 元素以在图像中渲染确切的文字；保持字符串简洁，并使用专用的 bbox 放置它们。
从 style_description.color_palette 中选择 3–6 种颜色（大写十六进制），仅当需要局部覆盖时才添加每个元素的调色板。
对于布局，考虑三分法：改变 bbox 的大小和位置以创造深度；不重叠的框减少碰撞。
锁定噪声种子以再现构图；更改它以探索变化而不更改您的 JSON。
如果您看到“图像被安全过滤器阻止”，该响应来自模型本身；调整内容以适应安全的、符合模式的提示。有关详细信息，请参阅模型卡：ideogram-ai/ideogram-4-fp8。

致谢#

此工作流程实现并建立在以下作品和资源之上。我们感谢 Comfy-Org 对 ComfyUI Day 0 支持公告和 Ideogram 4 工作流程模板的支持，感谢 Comfy-Org 对 Ideogram-4 模型卡的贡献，以及感谢 ideogram-oss 对 Ideogram 4 推理代码库的贡献和维护。有关权威详细信息，请参阅以下链接的原始文档和存储库。

资源#

Comfy-Org/Comfy 博客公告
- 文档/发布说明：ComfyUI 中的 Ideogram 4 Day 0 支持
Comfy-Org/Comfy 工作流程模板
- GitHub: Comfy-Org/workflow_templates — image_ideogram4_t2i.json
Comfy-Org/Ideogram 4 ComfyUI 模型卡
- Hugging Face: Comfy-Org/Ideogram-4
ideogram-oss/Ideogram 4 推理代码库
- GitHub: ideogram-oss/ideogram4