ComfyUI>Fluxos de Trabalho>Ideogram 4 ComfyUI workflow | Gerador de Layout de Texto para Imagem

Ideogram 4 ComfyUI workflow | Gerador de Layout de Texto para Imagem

Workflow Name: RunComfy/Ideogram-4-ComfyUI
Workflow ID: 0000...1443
Este poderoso modelo permite gerar imagens claras e conscientes de layout com texto embutido diretamente a partir de prompts estruturados. Suporta definições de cena baseadas em JSON, controle de paleta de cores e ferramentas de composição visual organizadas. Ideal para designers que criam cartazes, layouts de marca e visuais ricos em tipografia. Construído para consistência criativa, ajuda a manter controle sobre cada elemento de design. Alcance gráficos de texto estruturados com maior precisão e liberdade de design usando esta ferramenta visualmente inteligente.

Ideogram 4 ComfyUI workflow Workflow

Ideogram 4 ComfyUI workflow | Structured Text-to-Image Generator
Want to run this workflow?
  • Fully operational workflows
  • No missing nodes or models
  • No manual setups required
  • Features stunning visuals

Ideogram 4 ComfyUI workflow Examples

ideogram-4-comfyui-workflow-structured-text-to-image-generator-1443-example_01.webp
ideogram-4-comfyui-workflow-structured-text-to-image-generator-1443-example_02.webp
ideogram-4-comfyui-workflow-structured-text-to-image-generator-1443-example_03.webp
ideogram-4-comfyui-workflow-structured-text-to-image-generator-1443-example_04.webp
ideogram-4-comfyui-workflow-structured-text-to-image-generator-1443-example_05.webp
ideogram-4-comfyui-workflow-structured-text-to-image-generator-1443-example_06.webp

Ideogram 4 ComfyUI workflow: texto para imagem estruturado com layout e tipografia precisos#

Este workflow Ideogram 4 ComfyUI é um modelo compacto, pronto para RunComfy, para Ideogram 4.0, um modelo de texto para imagem de pesos abertos construído para design, controle de layout e texto confiável na imagem. Transforma legendas JSON estruturadas em imagens com resumos de cena, blocos de estilo, caixas delimitadoras normalizadas e paletas de cores hexadecimais, tornando-o ideal para cartazes, comps de marca, gráficos pesados em tipografia e ilustrações conscientes de layout.

O gráfico oferece um pipeline de texto para imagem limpo e de caminho único, além de um construtor de prompts JSON opcional no gráfico. Se você já escreve prompts JSON, cole-os e renderize imediatamente; se preferir começar de uma ideia curta, o assistente LLM pode elaborar uma legenda correta de esquema que você pode visualizar e colar no gerador. Sob o capô, o fluxo de trabalho segue a amostragem DiT de correspondência de fluxo do Ideogram 4 com orientação assimétrica livre de classificadores.

Modelos principais no Comfyui Ideogram 4 ComfyUI workflow#

  • Ideogram 4 (FP8). O Transformer de Difusão de 9.3B parâmetros treinado com correspondência de fluxo, projetado para geração guiada por JSON, renderização de texto forte e controle de layout explícito. Cartão de modelo oficial: ideogram-ai/ideogram-4-fp8. Código de inferência: ideogram-oss/ideogram4.
  • Ramo Incondicional do Ideogram 4. Um checkpoint incondicional emparelhado usado para orientação assimétrica livre de classificadores durante a amostragem; embalado para ComfyUI junto com o modelo principal: Comfy-Org/Ideogram-4.
  • Qwen3‑VL‑8B‑Instruct (FP8). Um codificador de visão-linguagem usado como codificador de texto, fornecendo recursos semânticos em múltiplas escalas a partir do prompt: Qwen/Qwen3-VL-8B-Instruct-FP8 (repack ComfyUI: Comfy-Org/Qwen3-VL).
  • FLUX.2 VAE. O decodificador usado para transformar latentes amostrados em imagens finais, embalado para ComfyUI: Comfy-Org/flux2-dev.

Como usar o Comfyui Ideogram 4 ComfyUI workflow#

Lógica geral: escolha uma tela, forneça um prompt (idealmente JSON estruturado), escolha um preset de amostrador (Padrão, Qualidade, Turbo), então renderize. O subgráfico principal “Texto para Imagem (Ideogram v4)” realiza codificação, orientação, amostragem e decodificação em uma única passagem; um grupo opcional “Construtor de Prompt LLM” pode elaborar JSON para você.

  • Tela e proporção: ResolutionSelector (#37)
    • Escolha um preset como 1:1, 16:9 ou 9:16. O fluxo de trabalho calcula dimensões válidas para o Ideogram 4 (múltiplos de 16 com mínimos sensatos) e as propaga para o amostrador e VAE. Isso permite que você direcione tudo, desde miniaturas quadradas até cartazes altos sem matemática manual. Mude a qualquer momento; o agendador se adapta à sua resolução escolhida.
  • Prompt e legenda JSON: CLIP Text Encode (Positive Prompt) (#24)
    • Cole linguagem natural ou, para melhores resultados, uma legenda JSON estruturada seguindo o esquema do Ideogram 4. Use high_level_description, um bloco style_description (com color_palette como códigos hexadecimais em maiúsculas), e uma seção compositional_deconstruction. As caixas delimitadoras são normalizadas em uma grade de 0–1000 com a ordem [y_min, x_min, y_max, x_max] e a origem no canto superior esquerdo; inclua itens type: "text" para renderizar texto literal na imagem. O modelo é sensível à ordem das chaves; veja o guia oficial em docs/prompting.md.
  • Modo de preset (velocidade vs qualidade): grupo “Preset” dentro do subgráfico
    • Escolha um modo na entrada mode do subgráfico: Padrão (equilibrado), Qualidade (mais etapas e fidelidade), ou Turbo (menos etapas e feedback mais rápido). O fluxo de trabalho analisa uma pequena tabela de presets internos e roteia a contagem de etapas correspondente e parâmetros de agenda para o agendador. Mude de presets para iterar rapidamente, depois finalize com maior qualidade.
  • Amostragem e orientação: grupo “Sampling” dentro do subgráfico
    • O pipeline usa amostragem de correspondência de fluxo com um ramo incondicional emparelhado para orientação assimétrica livre de classificadores. O DualModelGuider mistura previsões condicionais e incondicionais, enquanto o Ideogram4Scheduler modela a programação de ruído para o tamanho e preset escolhidos. KSamplerSelect escolhe o algoritmo e SamplerCustomAdvanced executa a passagem de remoção de ruído antes da decodificação.
  • Modelos (pré-conectados): grupo “Models” dentro do subgráfico
    • O gráfico carrega o modelo principal Ideogram 4, seu parceiro incondicional, o codificador de texto Qwen3-VL, e o FLUX.2 VAE. Estes estão conectados ao guia, amostrador e decodificador. Normalmente, você não precisa mudar isso, mas a troca de modelos é possível se você estiver experimentando variantes embaladas para o ComfyUI.
  • Opcional: elaboração de JSON no gráfico: JSON Prompt Builder (Gemma4) (#134)
    • Selecione o grupo “LLM Prompt Builder (Selecione e Ctrl+B para habilitar)” para ligá-lo. Insira uma ideia curta no campo user_prompt; o nó elabora uma legenda JSON correta de esquema que você pode visualizar com PreviewAny (#111). Copie o JSON gerado para a entrada principal prompt para o subgráfico da imagem.
  • Saída: SaveImage (#158)
    • As imagens são gravadas em uma pasta nomeada para a versão do modelo. Renomeie o prefixo se quiser manter saídas de diferentes presets ou proporções separadas.

Nós-chave no Comfyui Ideogram 4 ComfyUI workflow#

  • CLIP Text Encode (Positive Prompt) (#24)
    • Codifica o prompt com Qwen3-VL para Ideogram 4. Use JSON estruturado para controle de layout, texto explícito na imagem e direcionamento de paleta. Mantenha a ordem das chaves estável e use [y_min, x_min, y_max, x_max] com valores em uma grade de 0–1000 para entradas bbox; isso corresponde ao esquema documentado do modelo em docs/prompting.md.
  • UNETLoader (#23)
    • Carrega o checkpoint principal do Ideogram 4 que realiza a remoção de ruído condicional. Este é o backbone que traduz sua legenda codificada em imagens; deixe como o lançamento oficial para os resultados mais consistentes: ideogram-ai/ideogram-4-fp8.
  • UNETLoader (#154)
    • Carrega o checkpoint incondicional do Ideogram 4 usado para orientação assimétrica livre de classificadores. Emparelhar isso com o modelo principal permite que o guia controle a adesão ao prompt e a qualidade geral da imagem separadamente: Comfy-Org/Ideogram-4.
  • DualModelGuider (#155)
    • Combina previsões condicionais e incondicionais para implementar orientação assimétrica livre de classificadores. Ajuste a força da orientação apenas se você entender a troca: muito pouco enfraquece a fidelidade do prompt; muito pode exagerar ou distorcer. Ao mudar de presets, revise a orientação para manter uma "sensação" semelhante.
  • Ideogram4Scheduler (#17)
    • Produz a programação de ruído e a contagem de etapas especializadas para o Ideogram 4 na largura e altura escolhidas. O grupo “Preset” alimenta os passos correspondentes e parâmetros de agenda; use Qualidade para renderizações finais, Turbo para rascunhos e Padrão para trabalho cotidiano.
  • SamplerCustomAdvanced (#12)
    • Executa a passagem de remoção de ruído usando o amostrador selecionado e os sigmas do agendador. Deixe isso inalterado, a menos que você esteja intencionalmente comparando famílias de amostradores; se você trocar amostradores, mantenha a resolução e o preset fixos para que os A/Bs sejam significativos.
  • CFGOverride (#157)
    • Fornece um controle fino sobre como o condicionamento é aplicado durante a amostragem. A maioria dos usuários pode ignorar isso e confiar nos presets; se você o ajustar, faça pequenas mudanças e reavalie em múltiplos prompts para evitar ajustar demais o comportamento do amostrador a uma única cena.
  • VAELoader (#9) e VAEDecode (#13)
    • Carregue e aplique o FLUX.2 VAE para decodificar latentes amostrados em imagens finais. Mantenha o VAE oficial para preservar a colorimetria e o equilíbrio de detalhes, a menos que você esteja testando alternativas: Comfy-Org/flux2-dev.

Extras opcionais#

  • Use elementos type: "text" em seu JSON para renderizar a redação exata na imagem; mantenha as strings concisas e posicione-as com um bbox dedicado.
  • Comece com 3–6 cores em style_description.color_palette (hex em maiúsculas) e adicione paletas por elemento apenas quando precisar de substituições locais.
  • Para layout, pense em terços: varie tamanhos e posições de bbox para criar profundidade; caixas não sobrepostas reduzem colisões.
  • Trave a semente de ruído para reproduzir uma composição; mude-a para explorar variações sem alterar seu JSON.
  • Se você vir "Imagem bloqueada por filtro de segurança", essa resposta vem do próprio modelo; ajuste o conteúdo para prompts seguros e consistentes com o esquema. Para detalhes completos, veja o cartão de modelo: ideogram-ai/ideogram-4-fp8.

Agradecimentos#

Este fluxo de trabalho implementa e se baseia nos seguintes trabalhos e recursos. Agradecemos imensamente à Comfy-Org pelo anúncio de suporte do Dia 0 do ComfyUI e pelo modelo de fluxo de trabalho para Ideogram 4, à Comfy-Org pelo cartão de modelo Ideogram-4, e ao ideogram-oss pelo repositório de código aberto Ideogram 4 por suas contribuições e manutenção. Para detalhes autoritativos, consulte a documentação original e os repositórios vinculados abaixo.

Recursos#

Nota: O uso dos modelos, conjuntos de dados e código referenciados está sujeito às respectivas licenças e termos fornecidos por seus autores e mantenedores.

RunComfy
Copyright 2026 RunComfy. Todos os Direitos Reservados.

RunComfy é a principal ComfyUI plataforma, oferecendo ComfyUI online ambiente e serviços, juntamente com fluxos de trabalho do ComfyUI apresentando visuais impressionantes. RunComfy também oferece AI Models, permitindo que artistas utilizem as mais recentes ferramentas de AI para criar arte incrível.