Ideogram 4 ComfyUI workflow | Gerador de Layout de Texto para Imagem

Ideogram 4 ComfyUI workflow Workflow

Ideogram 4 ComfyUI workflow | Structured Text-to-Image Generator

Deseja executar este fluxo de trabalho?

Fluxos de trabalho totalmente operacionais
Sem nós ou modelos ausentes
Nenhuma configuração manual necessária
Apresenta visuais impressionantes

Ideogram 4 ComfyUI workflow Examples

ideogram-4-comfyui-workflow-structured-text-to-image-generator-1443-example_01.webp

ideogram-4-comfyui-workflow-structured-text-to-image-generator-1443-example_02.webp

ideogram-4-comfyui-workflow-structured-text-to-image-generator-1443-example_03.webp

ideogram-4-comfyui-workflow-structured-text-to-image-generator-1443-example_04.webp

ideogram-4-comfyui-workflow-structured-text-to-image-generator-1443-example_05.webp

ideogram-4-comfyui-workflow-structured-text-to-image-generator-1443-example_06.webp

Ideogram 4 ComfyUI workflow: texto para imagem estruturado com layout e tipografia precisos#

Este workflow Ideogram 4 ComfyUI é um modelo compacto, pronto para RunComfy, para Ideogram 4.0, um modelo de texto para imagem de pesos abertos construído para design, controle de layout e texto confiável na imagem. Transforma legendas JSON estruturadas em imagens com resumos de cena, blocos de estilo, caixas delimitadoras normalizadas e paletas de cores hexadecimais, tornando-o ideal para cartazes, comps de marca, gráficos pesados em tipografia e ilustrações conscientes de layout.

O gráfico oferece um pipeline de texto para imagem limpo e de caminho único, além de um construtor de prompts JSON opcional no gráfico. Se você já escreve prompts JSON, cole-os e renderize imediatamente; se preferir começar de uma ideia curta, o assistente LLM pode elaborar uma legenda correta de esquema que você pode visualizar e colar no gerador. Sob o capô, o fluxo de trabalho segue a amostragem DiT de correspondência de fluxo do Ideogram 4 com orientação assimétrica livre de classificadores.

Modelos principais no Comfyui Ideogram 4 ComfyUI workflow#

Ideogram 4 (FP8). O Transformer de Difusão de 9.3B parâmetros treinado com correspondência de fluxo, projetado para geração guiada por JSON, renderização de texto forte e controle de layout explícito. Cartão de modelo oficial: ideogram-ai/ideogram-4-fp8. Código de inferência: ideogram-oss/ideogram4.
Ramo Incondicional do Ideogram 4. Um checkpoint incondicional emparelhado usado para orientação assimétrica livre de classificadores durante a amostragem; embalado para ComfyUI junto com o modelo principal: Comfy-Org/Ideogram-4.
Qwen3‑VL‑8B‑Instruct (FP8). Um codificador de visão-linguagem usado como codificador de texto, fornecendo recursos semânticos em múltiplas escalas a partir do prompt: Qwen/Qwen3-VL-8B-Instruct-FP8 (repack ComfyUI: Comfy-Org/Qwen3-VL).
FLUX.2 VAE. O decodificador usado para transformar latentes amostrados em imagens finais, embalado para ComfyUI: Comfy-Org/flux2-dev.

Como usar o Comfyui Ideogram 4 ComfyUI workflow#

Lógica geral: escolha uma tela, forneça um prompt (idealmente JSON estruturado), escolha um preset de amostrador (Padrão, Qualidade, Turbo), então renderize. O subgráfico principal “Texto para Imagem (Ideogram v4)” realiza codificação, orientação, amostragem e decodificação em uma única passagem; um grupo opcional “Construtor de Prompt LLM” pode elaborar JSON para você.

Tela e proporção: ResolutionSelector (#37)
- Escolha um preset como 1:1, 16:9 ou 9:16. O fluxo de trabalho calcula dimensões válidas para o Ideogram 4 (múltiplos de 16 com mínimos sensatos) e as propaga para o amostrador e VAE. Isso permite que você direcione tudo, desde miniaturas quadradas até cartazes altos sem matemática manual. Mude a qualquer momento; o agendador se adapta à sua resolução escolhida.
Prompt e legenda JSON: CLIP Text Encode (Positive Prompt) (#24)
- Cole linguagem natural ou, para melhores resultados, uma legenda JSON estruturada seguindo o esquema do Ideogram 4. Use high_level_description, um bloco style_description (com color_palette como códigos hexadecimais em maiúsculas), e uma seção compositional_deconstruction. As caixas delimitadoras são normalizadas em uma grade de 0–1000 com a ordem [y_min, x_min, y_max, x_max] e a origem no canto superior esquerdo; inclua itens type: "text" para renderizar texto literal na imagem. O modelo é sensível à ordem das chaves; veja o guia oficial em docs/prompting.md.
Modo de preset (velocidade vs qualidade): grupo “Preset” dentro do subgráfico
- Escolha um modo na entrada mode do subgráfico: Padrão (equilibrado), Qualidade (mais etapas e fidelidade), ou Turbo (menos etapas e feedback mais rápido). O fluxo de trabalho analisa uma pequena tabela de presets internos e roteia a contagem de etapas correspondente e parâmetros de agenda para o agendador. Mude de presets para iterar rapidamente, depois finalize com maior qualidade.
Amostragem e orientação: grupo “Sampling” dentro do subgráfico
- O pipeline usa amostragem de correspondência de fluxo com um ramo incondicional emparelhado para orientação assimétrica livre de classificadores. O DualModelGuider mistura previsões condicionais e incondicionais, enquanto o Ideogram4Scheduler modela a programação de ruído para o tamanho e preset escolhidos. KSamplerSelect escolhe o algoritmo e SamplerCustomAdvanced executa a passagem de remoção de ruído antes da decodificação.
Modelos (pré-conectados): grupo “Models” dentro do subgráfico
- O gráfico carrega o modelo principal Ideogram 4, seu parceiro incondicional, o codificador de texto Qwen3-VL, e o FLUX.2 VAE. Estes estão conectados ao guia, amostrador e decodificador. Normalmente, você não precisa mudar isso, mas a troca de modelos é possível se você estiver experimentando variantes embaladas para o ComfyUI.
Opcional: elaboração de JSON no gráfico: JSON Prompt Builder (Gemma4) (#134)
- Selecione o grupo “LLM Prompt Builder (Selecione e Ctrl+B para habilitar)” para ligá-lo. Insira uma ideia curta no campo user_prompt; o nó elabora uma legenda JSON correta de esquema que você pode visualizar com PreviewAny (#111). Copie o JSON gerado para a entrada principal prompt para o subgráfico da imagem.
Saída: SaveImage (#158)
- As imagens são gravadas em uma pasta nomeada para a versão do modelo. Renomeie o prefixo se quiser manter saídas de diferentes presets ou proporções separadas.

Nós-chave no Comfyui Ideogram 4 ComfyUI workflow#

CLIP Text Encode (Positive Prompt) (#24)
- Codifica o prompt com Qwen3-VL para Ideogram 4. Use JSON estruturado para controle de layout, texto explícito na imagem e direcionamento de paleta. Mantenha a ordem das chaves estável e use [y_min, x_min, y_max, x_max] com valores em uma grade de 0–1000 para entradas bbox; isso corresponde ao esquema documentado do modelo em docs/prompting.md.
UNETLoader (#23)
- Carrega o checkpoint principal do Ideogram 4 que realiza a remoção de ruído condicional. Este é o backbone que traduz sua legenda codificada em imagens; deixe como o lançamento oficial para os resultados mais consistentes: ideogram-ai/ideogram-4-fp8.
UNETLoader (#154)
- Carrega o checkpoint incondicional do Ideogram 4 usado para orientação assimétrica livre de classificadores. Emparelhar isso com o modelo principal permite que o guia controle a adesão ao prompt e a qualidade geral da imagem separadamente: Comfy-Org/Ideogram-4.
DualModelGuider (#155)
- Combina previsões condicionais e incondicionais para implementar orientação assimétrica livre de classificadores. Ajuste a força da orientação apenas se você entender a troca: muito pouco enfraquece a fidelidade do prompt; muito pode exagerar ou distorcer. Ao mudar de presets, revise a orientação para manter uma "sensação" semelhante.
Ideogram4Scheduler (#17)
- Produz a programação de ruído e a contagem de etapas especializadas para o Ideogram 4 na largura e altura escolhidas. O grupo “Preset” alimenta os passos correspondentes e parâmetros de agenda; use Qualidade para renderizações finais, Turbo para rascunhos e Padrão para trabalho cotidiano.
SamplerCustomAdvanced (#12)
- Executa a passagem de remoção de ruído usando o amostrador selecionado e os sigmas do agendador. Deixe isso inalterado, a menos que você esteja intencionalmente comparando famílias de amostradores; se você trocar amostradores, mantenha a resolução e o preset fixos para que os A/Bs sejam significativos.
CFGOverride (#157)
- Fornece um controle fino sobre como o condicionamento é aplicado durante a amostragem. A maioria dos usuários pode ignorar isso e confiar nos presets; se você o ajustar, faça pequenas mudanças e reavalie em múltiplos prompts para evitar ajustar demais o comportamento do amostrador a uma única cena.
VAELoader (#9) e VAEDecode (#13)
- Carregue e aplique o FLUX.2 VAE para decodificar latentes amostrados em imagens finais. Mantenha o VAE oficial para preservar a colorimetria e o equilíbrio de detalhes, a menos que você esteja testando alternativas: Comfy-Org/flux2-dev.

Extras opcionais#

Use elementos type: "text" em seu JSON para renderizar a redação exata na imagem; mantenha as strings concisas e posicione-as com um bbox dedicado.
Comece com 3–6 cores em style_description.color_palette (hex em maiúsculas) e adicione paletas por elemento apenas quando precisar de substituições locais.
Para layout, pense em terços: varie tamanhos e posições de bbox para criar profundidade; caixas não sobrepostas reduzem colisões.
Trave a semente de ruído para reproduzir uma composição; mude-a para explorar variações sem alterar seu JSON.
Se você vir "Imagem bloqueada por filtro de segurança", essa resposta vem do próprio modelo; ajuste o conteúdo para prompts seguros e consistentes com o esquema. Para detalhes completos, veja o cartão de modelo: ideogram-ai/ideogram-4-fp8.

Agradecimentos#

Este fluxo de trabalho implementa e se baseia nos seguintes trabalhos e recursos. Agradecemos imensamente à Comfy-Org pelo anúncio de suporte do Dia 0 do ComfyUI e pelo modelo de fluxo de trabalho para Ideogram 4, à Comfy-Org pelo cartão de modelo Ideogram-4, e ao ideogram-oss pelo repositório de código aberto Ideogram 4 por suas contribuições e manutenção. Para detalhes autoritativos, consulte a documentação original e os repositórios vinculados abaixo.

Recursos#

Comfy-Org/Anúncio do blog Comfy
- Docs / Notas de Lançamento: Suporte do Dia 0 do Ideogram 4 no ComfyUI
Comfy-Org/Modelo de fluxo de trabalho Comfy
- GitHub: Comfy-Org/workflow_templates — image_ideogram4_t2i.json
Cartão de modelo Comfy-Org/Ideogram 4 ComfyUI
- Hugging Face: Comfy-Org/Ideogram-4
Repositório de código aberto ideogram-oss/Ideogram 4
- GitHub: ideogram-oss/ideogram4

Nota: O uso dos modelos, conjuntos de dados e código referenciados está sujeito às respectivas licenças e termos fornecidos por seus autores e mantenedores.

Want More ComfyUI Workflows?

Qwen-Image | Gerador de Cartazes Multi-Texto em HD

Nova Era da Geração de Texto em Imagens!

Qwen-Image Lightning | Aumento de Velocidade em 8 Passos

Reduza o tempo de geração pela metade.

Omost | Melhore a Criação de Imagens

Omost usa codificação LLM para gerar imagens precisas e de alta qualidade.

ERNIE-Image ComfyUI | Gerador Inteligente de Texto para Imagem

Transforma palavras em visuais precisos e detalhados instantaneamente.

SAM 3.1 ComfyUI | Segmentação & Rastreamento Nativos

Precisão insana para segmentação de imagens e rastreamento de objetos.

FlashVSR | Ampliador de Vídeo em Tempo Real

Aumente a resolução dos vídeos de forma rápida, suave e super clara—sem perder detalhes.

Wan 2.1 Video Restyle | Transformação Consistente de Estilo de Vídeo

Transforme o estilo do seu vídeo aplicando o primeiro quadro reestilizado usando o fluxo de trabalho Wan 2.1 video restyle.

Fish Audio S2 TTS | Gerador de Voz Expressiva

Crie fala realista com emoções, estilos e vozes clonadas rapidamente.

Suporte

Recursos

Legal

RunComfy

RunComfy é a principal ComfyUI plataforma, oferecendo ComfyUI online ambiente e serviços, juntamente com fluxos de trabalho do ComfyUI apresentando visuais impressionantes. RunComfy também oferece AI Models, permitindo que artistas utilizem as mais recentes ferramentas de AI para criar arte incrível.