Ideogram 4 ComfyUI workflow: texto para imagem estruturado com layout e tipografia precisos#
Este workflow Ideogram 4 ComfyUI é um modelo compacto, pronto para RunComfy, para Ideogram 4.0, um modelo de texto para imagem de pesos abertos construído para design, controle de layout e texto confiável na imagem. Transforma legendas JSON estruturadas em imagens com resumos de cena, blocos de estilo, caixas delimitadoras normalizadas e paletas de cores hexadecimais, tornando-o ideal para cartazes, comps de marca, gráficos pesados em tipografia e ilustrações conscientes de layout.
O gráfico oferece um pipeline de texto para imagem limpo e de caminho único, além de um construtor de prompts JSON opcional no gráfico. Se você já escreve prompts JSON, cole-os e renderize imediatamente; se preferir começar de uma ideia curta, o assistente LLM pode elaborar uma legenda correta de esquema que você pode visualizar e colar no gerador. Sob o capô, o fluxo de trabalho segue a amostragem DiT de correspondência de fluxo do Ideogram 4 com orientação assimétrica livre de classificadores.
Modelos principais no Comfyui Ideogram 4 ComfyUI workflow#
- Ideogram 4 (FP8). O Transformer de Difusão de 9.3B parâmetros treinado com correspondência de fluxo, projetado para geração guiada por JSON, renderização de texto forte e controle de layout explícito. Cartão de modelo oficial: ideogram-ai/ideogram-4-fp8. Código de inferência: ideogram-oss/ideogram4.
- Ramo Incondicional do Ideogram 4. Um checkpoint incondicional emparelhado usado para orientação assimétrica livre de classificadores durante a amostragem; embalado para ComfyUI junto com o modelo principal: Comfy-Org/Ideogram-4.
- Qwen3‑VL‑8B‑Instruct (FP8). Um codificador de visão-linguagem usado como codificador de texto, fornecendo recursos semânticos em múltiplas escalas a partir do prompt: Qwen/Qwen3-VL-8B-Instruct-FP8 (repack ComfyUI: Comfy-Org/Qwen3-VL).
- FLUX.2 VAE. O decodificador usado para transformar latentes amostrados em imagens finais, embalado para ComfyUI: Comfy-Org/flux2-dev.
Como usar o Comfyui Ideogram 4 ComfyUI workflow#
Lógica geral: escolha uma tela, forneça um prompt (idealmente JSON estruturado), escolha um preset de amostrador (Padrão, Qualidade, Turbo), então renderize. O subgráfico principal “Texto para Imagem (Ideogram v4)” realiza codificação, orientação, amostragem e decodificação em uma única passagem; um grupo opcional “Construtor de Prompt LLM” pode elaborar JSON para você.
- Tela e proporção:
ResolutionSelector(#37)- Escolha um preset como 1:1, 16:9 ou 9:16. O fluxo de trabalho calcula dimensões válidas para o Ideogram 4 (múltiplos de 16 com mínimos sensatos) e as propaga para o amostrador e VAE. Isso permite que você direcione tudo, desde miniaturas quadradas até cartazes altos sem matemática manual. Mude a qualquer momento; o agendador se adapta à sua resolução escolhida.
- Prompt e legenda JSON:
CLIP Text Encode (Positive Prompt)(#24)- Cole linguagem natural ou, para melhores resultados, uma legenda JSON estruturada seguindo o esquema do Ideogram 4. Use
high_level_description, um blocostyle_description(comcolor_palettecomo códigos hexadecimais em maiúsculas), e uma seçãocompositional_deconstruction. As caixas delimitadoras são normalizadas em uma grade de 0–1000 com a ordem[y_min, x_min, y_max, x_max]e a origem no canto superior esquerdo; inclua itenstype: "text"para renderizar texto literal na imagem. O modelo é sensível à ordem das chaves; veja o guia oficial em docs/prompting.md.
- Cole linguagem natural ou, para melhores resultados, uma legenda JSON estruturada seguindo o esquema do Ideogram 4. Use
- Modo de preset (velocidade vs qualidade): grupo “Preset” dentro do subgráfico
- Escolha um modo na entrada
modedo subgráfico: Padrão (equilibrado), Qualidade (mais etapas e fidelidade), ou Turbo (menos etapas e feedback mais rápido). O fluxo de trabalho analisa uma pequena tabela de presets internos e roteia a contagem de etapas correspondente e parâmetros de agenda para o agendador. Mude de presets para iterar rapidamente, depois finalize com maior qualidade.
- Escolha um modo na entrada
- Amostragem e orientação: grupo “Sampling” dentro do subgráfico
- O pipeline usa amostragem de correspondência de fluxo com um ramo incondicional emparelhado para orientação assimétrica livre de classificadores. O
DualModelGuidermistura previsões condicionais e incondicionais, enquanto oIdeogram4Schedulermodela a programação de ruído para o tamanho e preset escolhidos.KSamplerSelectescolhe o algoritmo eSamplerCustomAdvancedexecuta a passagem de remoção de ruído antes da decodificação.
- O pipeline usa amostragem de correspondência de fluxo com um ramo incondicional emparelhado para orientação assimétrica livre de classificadores. O
- Modelos (pré-conectados): grupo “Models” dentro do subgráfico
- O gráfico carrega o modelo principal Ideogram 4, seu parceiro incondicional, o codificador de texto Qwen3-VL, e o FLUX.2 VAE. Estes estão conectados ao guia, amostrador e decodificador. Normalmente, você não precisa mudar isso, mas a troca de modelos é possível se você estiver experimentando variantes embaladas para o ComfyUI.
- Opcional: elaboração de JSON no gráfico:
JSON Prompt Builder (Gemma4)(#134)- Selecione o grupo “LLM Prompt Builder (Selecione e Ctrl+B para habilitar)” para ligá-lo. Insira uma ideia curta no campo
user_prompt; o nó elabora uma legenda JSON correta de esquema que você pode visualizar comPreviewAny(#111). Copie o JSON gerado para a entrada principalpromptpara o subgráfico da imagem.
- Selecione o grupo “LLM Prompt Builder (Selecione e Ctrl+B para habilitar)” para ligá-lo. Insira uma ideia curta no campo
- Saída:
SaveImage(#158)- As imagens são gravadas em uma pasta nomeada para a versão do modelo. Renomeie o prefixo se quiser manter saídas de diferentes presets ou proporções separadas.
Nós-chave no Comfyui Ideogram 4 ComfyUI workflow#
CLIP Text Encode (Positive Prompt)(#24)- Codifica o prompt com Qwen3-VL para Ideogram 4. Use JSON estruturado para controle de layout, texto explícito na imagem e direcionamento de paleta. Mantenha a ordem das chaves estável e use
[y_min, x_min, y_max, x_max]com valores em uma grade de 0–1000 para entradasbbox; isso corresponde ao esquema documentado do modelo em docs/prompting.md.
- Codifica o prompt com Qwen3-VL para Ideogram 4. Use JSON estruturado para controle de layout, texto explícito na imagem e direcionamento de paleta. Mantenha a ordem das chaves estável e use
UNETLoader(#23)- Carrega o checkpoint principal do Ideogram 4 que realiza a remoção de ruído condicional. Este é o backbone que traduz sua legenda codificada em imagens; deixe como o lançamento oficial para os resultados mais consistentes: ideogram-ai/ideogram-4-fp8.
UNETLoader(#154)- Carrega o checkpoint incondicional do Ideogram 4 usado para orientação assimétrica livre de classificadores. Emparelhar isso com o modelo principal permite que o guia controle a adesão ao prompt e a qualidade geral da imagem separadamente: Comfy-Org/Ideogram-4.
DualModelGuider(#155)- Combina previsões condicionais e incondicionais para implementar orientação assimétrica livre de classificadores. Ajuste a força da orientação apenas se você entender a troca: muito pouco enfraquece a fidelidade do prompt; muito pode exagerar ou distorcer. Ao mudar de presets, revise a orientação para manter uma "sensação" semelhante.
Ideogram4Scheduler(#17)- Produz a programação de ruído e a contagem de etapas especializadas para o Ideogram 4 na largura e altura escolhidas. O grupo “Preset” alimenta os passos correspondentes e parâmetros de agenda; use Qualidade para renderizações finais, Turbo para rascunhos e Padrão para trabalho cotidiano.
SamplerCustomAdvanced(#12)- Executa a passagem de remoção de ruído usando o amostrador selecionado e os
sigmasdo agendador. Deixe isso inalterado, a menos que você esteja intencionalmente comparando famílias de amostradores; se você trocar amostradores, mantenha a resolução e o preset fixos para que os A/Bs sejam significativos.
- Executa a passagem de remoção de ruído usando o amostrador selecionado e os
CFGOverride(#157)- Fornece um controle fino sobre como o condicionamento é aplicado durante a amostragem. A maioria dos usuários pode ignorar isso e confiar nos presets; se você o ajustar, faça pequenas mudanças e reavalie em múltiplos prompts para evitar ajustar demais o comportamento do amostrador a uma única cena.
VAELoader(#9) eVAEDecode(#13)- Carregue e aplique o FLUX.2 VAE para decodificar latentes amostrados em imagens finais. Mantenha o VAE oficial para preservar a colorimetria e o equilíbrio de detalhes, a menos que você esteja testando alternativas: Comfy-Org/flux2-dev.
Extras opcionais#
- Use elementos
type: "text"em seu JSON para renderizar a redação exata na imagem; mantenha as strings concisas e posicione-as com umbboxdedicado. - Comece com 3–6 cores em
style_description.color_palette(hex em maiúsculas) e adicione paletas por elemento apenas quando precisar de substituições locais. - Para layout, pense em terços: varie tamanhos e posições de
bboxpara criar profundidade; caixas não sobrepostas reduzem colisões. - Trave a semente de ruído para reproduzir uma composição; mude-a para explorar variações sem alterar seu JSON.
- Se você vir "Imagem bloqueada por filtro de segurança", essa resposta vem do próprio modelo; ajuste o conteúdo para prompts seguros e consistentes com o esquema. Para detalhes completos, veja o cartão de modelo: ideogram-ai/ideogram-4-fp8.
Agradecimentos#
Este fluxo de trabalho implementa e se baseia nos seguintes trabalhos e recursos. Agradecemos imensamente à Comfy-Org pelo anúncio de suporte do Dia 0 do ComfyUI e pelo modelo de fluxo de trabalho para Ideogram 4, à Comfy-Org pelo cartão de modelo Ideogram-4, e ao ideogram-oss pelo repositório de código aberto Ideogram 4 por suas contribuições e manutenção. Para detalhes autoritativos, consulte a documentação original e os repositórios vinculados abaixo.
Recursos#
- Comfy-Org/Anúncio do blog Comfy
- Docs / Notas de Lançamento: Suporte do Dia 0 do Ideogram 4 no ComfyUI
- Comfy-Org/Modelo de fluxo de trabalho Comfy
- Cartão de modelo Comfy-Org/Ideogram 4 ComfyUI
- Hugging Face: Comfy-Org/Ideogram-4
- Repositório de código aberto ideogram-oss/Ideogram 4
- GitHub: ideogram-oss/ideogram4
Nota: O uso dos modelos, conjuntos de dados e código referenciados está sujeito às respectivas licenças e termos fornecidos por seus autores e mantenedores.









