Ideogram 4 ComfyUI workflow | Générateur de mise en page de texte en image

Ideogram 4 ComfyUI workflow Workflow

Ideogram 4 ComfyUI workflow | Structured Text-to-Image Generator

Want to run this workflow?

Fully operational workflows
No missing nodes or models
No manual setups required
Features stunning visuals

Ideogram 4 ComfyUI workflow Examples

ideogram-4-comfyui-workflow-structured-text-to-image-generator-1443-example_01.webp

ideogram-4-comfyui-workflow-structured-text-to-image-generator-1443-example_02.webp

ideogram-4-comfyui-workflow-structured-text-to-image-generator-1443-example_03.webp

ideogram-4-comfyui-workflow-structured-text-to-image-generator-1443-example_04.webp

ideogram-4-comfyui-workflow-structured-text-to-image-generator-1443-example_05.webp

ideogram-4-comfyui-workflow-structured-text-to-image-generator-1443-example_06.webp

Ideogram 4 ComfyUI workflow : texte en image structuré avec mise en page précise et typographie#

Ce flux de travail Ideogram 4 ComfyUI est un modèle compact, prêt à l'emploi pour Ideogram 4.0, un modèle de texte en image à poids ouverts conçu pour le design, le contrôle de la mise en page et le texte en image fiable. Il transforme les légendes JSON structurées en images avec des résumés de scène, des blocs de style, des boîtes englobantes normalisées et des palettes de couleurs hexadécimales, ce qui le rend idéal pour les affiches, les compositions de marque, les graphiques riches en typographie et les illustrations conscientes de la mise en page.

Le graphe offre un pipeline de texte en image propre à chemin unique plus un générateur de prompt JSON optionnel sur le graphe. Si vous écrivez déjà des prompts JSON, collez-les et rendez immédiatement ; si vous préférez partir d'une idée courte, l'assistant LLM peut rédiger une légende correcte que vous pouvez prévisualiser et coller dans le générateur. Sous le capot, le flux de travail suit l'échantillonnage DiT à correspondance de flux d'Ideogram 4 avec une guidance asymétrique sans classificateur.

Modèles clés dans le flux de travail Comfyui Ideogram 4 ComfyUI#

Ideogram 4 (FP8). Le transformateur de diffusion à 9,3 milliards de paramètres entraîné avec la correspondance de flux, conçu pour la génération guidée par JSON, le rendu de texte fort et le contrôle explicite de la mise en page. Carte de modèle officielle : ideogram-ai/ideogram-4-fp8. Code d'inférence : ideogram-oss/ideogram4.
Branche Inconditionnelle Ideogram 4. Un point de contrôle inconditionnel associé utilisé pour la guidance asymétrique sans classificateur lors de l'échantillonnage ; emballé pour ComfyUI avec le modèle principal : Comfy-Org/Ideogram-4.
Qwen3‑VL‑8B‑Instruct (FP8). Un encodeur de vision et de langage utilisé comme encodeur de texte, fournissant des caractéristiques sémantiques multi-échelles à partir du prompt : Qwen/Qwen3-VL-8B-Instruct-FP8 (reconditionnement ComfyUI : Comfy-Org/Qwen3-VL).
FLUX.2 VAE. Le décodeur utilisé pour transformer les latents échantillonnés en images finales, emballé pour ComfyUI : Comfy-Org/flux2-dev.

Comment utiliser le flux de travail Comfyui Ideogram 4 ComfyUI#

Logique générale : choisissez une toile, fournissez un prompt (idéalement JSON structuré), choisissez un préréglage d'échantillonneur (Par défaut, Qualité, Turbo), puis rendez. Le sous-graphe principal “Texte en Image (Ideogram v4)” effectue l'encodage, la guidance, l'échantillonnage et le décodage en un seul passage ; un groupe “Constructeur de Prompt LLM” optionnel peut rédiger du JSON pour vous.

Toile et rapport d'aspect : ResolutionSelector (#37)
- Choisissez un préréglage comme 1:1, 16:9 ou 9:16. Le flux de travail calcule les dimensions valides pour Ideogram 4 (multiples de 16 avec des minimums raisonnables) et les propage à l'échantillonneur et au VAE. Cela vous permet de cibler tout, des vignettes carrées aux affiches hautes sans mathématiques manuelles. Changez à tout moment ; le planificateur s'adapte à votre résolution choisie.
Prompt et légende JSON : CLIP Text Encode (Positive Prompt) (#24)
- Collez du langage naturel ou, pour de meilleurs résultats, une légende JSON structurée suivant le schéma d'Ideogram 4. Utilisez high_level_description, un bloc style_description (avec color_palette en codes hexadécimaux majuscules), et une section compositional_deconstruction. Les boîtes englobantes sont normalisées sur une grille de 0 à 1000 avec l'ordre [y_min, x_min, y_max, x_max] et l'origine en haut à gauche ; incluez des éléments type: "text" pour rendre du texte littéral dans l'image. Le modèle est sensible à l'ordre des clés ; voir le guide officiel dans docs/prompting.md.
Mode préréglé (vitesse vs qualité) : groupe “Preset” à l'intérieur du sous-graphe
- Choisissez un mode dans l'entrée mode du sous-graphe : Par défaut (équilibré), Qualité (plus d'étapes et de fidélité), ou Turbo (moins d'étapes et retour plus rapide). Le flux de travail analyse un petit tableau de préréglages internes et achemine le compte d'étapes correspondant et les paramètres de l'horaire vers le planificateur. Changez de préréglage pour itérer rapidement, puis terminez avec une qualité supérieure.
Échantillonnage et guidance : groupe “Sampling” à l'intérieur du sous-graphe
- Le pipeline utilise l'échantillonnage à correspondance de flux avec une branche inconditionnelle associée pour la guidance asymétrique sans classificateur. Le DualModelGuider mélange les prédictions conditionnelles et inconditionnelles, tandis que Ideogram4Scheduler façonne l'horaire du bruit pour votre taille et préréglage choisis. KSamplerSelect choisit l'algorithme et SamplerCustomAdvanced exécute le passage de débruitage avant le décodage.
Modèles (pré-câblés) : groupe “Models” à l'intérieur du sous-graphe
- Le graphe charge le modèle principal Ideogram 4, son partenaire inconditionnel, l'encodeur de texte Qwen3‑VL, et le FLUX.2 VAE. Ceux-ci sont câblés dans le guideur, l'échantillonneur et le décodeur. Vous n'avez normalement pas besoin de changer ceux-ci, mais remplacer les modèles est possible si vous expérimentez avec des variantes emballées pour ComfyUI.
Optionnel : rédaction de JSON sur le graphe : JSON Prompt Builder (Gemma4) (#134)
- Sélectionnez le groupe “Constructeur de Prompt LLM (Sélectionnez et Ctrl+B pour activer)” pour l'activer. Entrez une idée courte dans le champ user_prompt ; le nœud rédige une légende JSON correcte que vous pouvez prévisualiser avec PreviewAny (#111). Copiez le JSON généré dans l'entrée principale prompt pour le sous-graphe d'image.
Sortie : SaveImage (#158)
- Les images sont écrites sous un dossier nommé pour la version du modèle. Renommez le préfixe si vous souhaitez garder les sorties de différents préréglages ou rapports d'aspect séparés.

Nœuds clés dans le flux de travail Comfyui Ideogram 4 ComfyUI#

CLIP Text Encode (Positive Prompt) (#24)
- Encode le prompt avec Qwen3‑VL pour Ideogram 4. Utilisez du JSON structuré pour le contrôle de la mise en page, le texte explicite dans l'image et la direction de la palette. Maintenez l'ordre des clés stable et utilisez [y_min, x_min, y_max, x_max] avec des valeurs sur une grille de 0 à 1000 pour les entrées bbox ; cela correspond au schéma documenté du modèle dans docs/prompting.md.
UNETLoader (#23)
- Charge le point de contrôle principal Ideogram 4 qui effectue le débruitage conditionnel. C'est la colonne vertébrale qui traduit votre légende encodée en images ; laissez-le comme la version officielle pour des résultats les plus cohérents : ideogram-ai/ideogram-4-fp8.
UNETLoader (#154)
- Charge le point de contrôle inconditionnel d'Ideogram 4 utilisé pour la guidance asymétrique sans classificateur. Associer cela avec le modèle principal permet au guideur de contrôler l'adhérence au prompt et la qualité globale de l'image séparément : Comfy-Org/Ideogram-4.
DualModelGuider (#155)
- Combine les prédictions conditionnelles et inconditionnelles pour mettre en œuvre la guidance asymétrique sans classificateur. Ajustez la force de la guidance uniquement si vous comprenez le compromis : trop peu affaiblit la fidélité du prompt ; trop peut trop affiner ou déformer. Lorsque vous changez de préréglage, revisitez la guidance pour maintenir une sensation similaire.
Ideogram4Scheduler (#17)
- Produit l'horaire du bruit et le compte d'étapes spécialisés pour Ideogram 4 à votre largeur et hauteur choisies. Le groupe “Preset” lui fournit les étapes et les paramètres d'horaire correspondants ; utilisez la Qualité pour les rendus finaux, Turbo pour les brouillons, et Par défaut pour le travail quotidien.
SamplerCustomAdvanced (#12)
- Exécute le passage de débruitage en utilisant l'échantillonneur sélectionné et les sigmas du planificateur. Laissez cela inchangé à moins que vous ne compariez intentionnellement les familles d'échantillonneurs ; si vous échangez des échantillonneurs, gardez la résolution et le préréglage fixes pour rendre les A/B significatifs.
CFGOverride (#157)
- Fournit un bouton de réglage précis sur la façon dont le conditionnement est appliqué lors de l'échantillonnage. La plupart des utilisateurs peuvent ignorer cela et se fier aux préréglages ; si vous le modifiez, faites de petits changements et réévaluez sur plusieurs prompts pour éviter de surajuster le comportement de l'échantillonneur à une seule scène.
VAELoader (#9) et VAEDecode (#13)
- Chargent et appliquent le FLUX.2 VAE pour décoder les latents échantillonnés en images finales. Gardez le VAE officiel pour préserver la colorimétrie et l'équilibre des détails à moins que vous ne testiez des alternatives : Comfy-Org/flux2-dev.

Extras optionnels#

Utilisez des éléments type: "text" dans votre JSON pour rendre des mots exacts dans l'image ; gardez les chaînes concises et placez-les avec un bbox dédié.
Commencez avec 3 à 6 couleurs dans style_description.color_palette (hex majuscule) et ajoutez des palettes par élément uniquement lorsque vous avez besoin de substitutions locales.
Pour la mise en page, pensez en tiers : variez les tailles et positions des bbox pour créer de la profondeur ; les boîtes non chevauchantes réduisent les collisions.
Verrouillez la graine de bruit pour reproduire une composition ; changez-la pour explorer des variations sans modifier votre JSON.
Si vous voyez “Image bloquée par le filtre de sécurité”, cette réponse provient du modèle lui-même ; ajustez le contenu vers des prompts sûrs et cohérents avec le schéma. Pour tous les détails, voir la carte du modèle : ideogram-ai/ideogram-4-fp8.

Remerciements#

Ce flux de travail implémente et s'appuie sur les travaux et ressources suivants. Nous remercions chaleureusement Comfy-Org pour l'annonce de support Day 0 de ComfyUI et le modèle de flux de travail pour Ideogram 4, Comfy-Org pour la carte du modèle Ideogram-4, et ideogram-oss pour le dépôt du code d’inférence Ideogram 4 pour leurs contributions et leur maintenance. Pour des détails autorisés, veuillez vous référer à la documentation et aux dépôts originaux liés ci-dessous.

Ressources#

Annonce de blog Comfy-Org/Comfy
- Docs / Notes de version : Support Day 0 d'Ideogram 4 dans ComfyUI
Modèle de flux de travail Comfy-Org/Comfy
- GitHub : Comfy-Org/workflow_templates — image_ideogram4_t2i.json
Carte du modèle Comfy-Org/Ideogram 4 ComfyUI
- Hugging Face : Comfy-Org/Ideogram-4
Dépôt du code d’inférence ideogram-oss/Ideogram 4
- GitHub : ideogram-oss/ideogram4

Remarque : L'utilisation des modèles, jeux de données et codes référencés est soumise aux licences et conditions respectives fournies par leurs auteurs et mainteneurs.

Want More ComfyUI Workflows?

Qwen-Image | Générateur d'Affiches Multi-Texte HD

Nouvelle ère de génération de texte dans les images !

Qwen-Image Lightning | Accélération en 8 étapes

Réduisez le temps de génération de moitié.

Omost | Améliorer la Création d'Images

Omost utilise le codage LLM pour générer des images précises et de haute qualité.

ERNIE-Image ComfyUI | Générateur intelligent d'images à partir de texte

Transforme instantanément les mots en visuels précis et détaillés.

Omni Kontext | Intégration de scène fluide

Ajustements de scène parfaits. Style unique. L'identité reste. Kontext garde ça réel.

Flux Consistent Characters | Input Image

Créez des personnages cohérents et assurez-vous qu'ils paraissent uniformes en utilisant vos images.

Workflow TripoSplat 3D Gaussian Splats | Image to 3D

Transformez une image en 3D Gaussian Splats avec TripoSplat.

AnimateDiff + Dynamic Prompts | Texte vers Vidéo

Utilisez Dynamic Prompts (Wildcards), Animatediff et IPAdapter pour générer des animations dynamiques ou des GIF.

Support

Ressources

Légal

RunComfy

RunComfy est la première ComfyUI plateforme, offrant des ComfyUI en ligne environnement et services, ainsi que des workflows ComfyUI proposant des visuels époustouflants. RunComfy propose également AI Models, permettant aux artistes d'utiliser les derniers outils d'IA pour créer des œuvres d'art incroyables.