Ideogram 4 ComfyUI workflow: texto a imagen estructurado con diseño y tipografía precisos#
Este flujo de trabajo de Ideogram 4 ComfyUI es una plantilla compacta, lista para RunComfy, para Ideogram 4.0, un modelo de texto a imagen de pesos abiertos construido para diseño, control de diseño y texto confiable en la imagen. Convierte leyendas JSON estructuradas en imágenes con resúmenes de escena, bloques de estilo, cajas delimitadoras normalizadas y paletas de colores hexadecimales, haciéndolo ideal para carteles, composiciones de marca, gráficos pesados en tipografía e ilustraciones conscientes del diseño.
El gráfico ofrece una canalización de texto a imagen limpia y de un solo camino más un generador de indicaciones JSON opcional en el gráfico. Si ya escribes indicaciones JSON, pégalas y renderiza inmediatamente; si prefieres comenzar con una idea corta, el asistente LLM puede redactar una leyenda correcta en esquema que puedes previsualizar y pegar en el generador. Bajo el capó, el flujo de trabajo sigue el muestreo de coincidencia de flujo de Ideogram 4 con guía libre de clasificador asimétrica.
Modelos clave en el flujo de trabajo de Comfyui Ideogram 4 ComfyUI#
- Ideogram 4 (FP8). El transformador de difusión de 9.3B parámetros entrenado con coincidencia de flujo, diseñado para generación guiada por JSON, fuerte renderizado de texto y control de diseño explícito. Tarjeta de modelo oficial: ideogram-ai/ideogram-4-fp8. Código de inferencia: ideogram-oss/ideogram4.
- Rama incondicional de Ideogram 4. Un punto de control incondicional emparejado utilizado para guía libre de clasificador asimétrica durante el muestreo; empaquetado para ComfyUI junto con el modelo principal: Comfy-Org/Ideogram-4.
- Qwen3-VL-8B-Instruct (FP8). Un codificador de visión-lenguaje utilizado como el codificador de texto, proporcionando características semánticas a múltiples escalas desde la indicación: Qwen/Qwen3-VL-8B-Instruct-FP8 (repaquete de ComfyUI: Comfy-Org/Qwen3-VL).
- FLUX.2 VAE. El decodificador utilizado para convertir latentes muestreados en imágenes finales, empaquetado para ComfyUI: Comfy-Org/flux2-dev.
Cómo usar el flujo de trabajo de Comfyui Ideogram 4 ComfyUI#
Lógica general: elige un lienzo, proporciona una indicación (idealmente JSON estructurado), elige un preajuste de muestreador (Default, Quality, Turbo), luego renderiza. El subgrafo principal “Texto a Imagen (Ideogram v4)” realiza codificación, guía, muestreo y decodificación en una pasada; un grupo opcional “LLM Prompt Builder” puede redactar JSON para ti.
- Lienzo y relación de aspecto:
ResolutionSelector(#37)- Elige un preajuste como 1:1, 16:9, o 9:16. El flujo de trabajo calcula dimensiones válidas para Ideogram 4 (múltiplos de 16 con mínimos razonables) y las propaga al muestreador y VAE. Esto te permite apuntar a todo, desde miniaturas cuadradas hasta carteles altos sin matemáticas manuales. Cambia en cualquier momento; el programador se adapta a tu resolución elegida.
- Indicaciones y leyenda JSON:
CLIP Text Encode (Positive Prompt)(#24)- Pega lenguaje natural o, para mejores resultados, una leyenda JSON estructurada siguiendo el esquema de Ideogram 4. Usa
high_level_description, un bloquestyle_description(concolor_palettecomo códigos hexadecimales en mayúsculas), y una sección decompositional_deconstruction. Las cajas delimitadoras están normalizadas en una cuadrícula de 0–1000 con el orden[y_min, x_min, y_max, x_max]y origen en la esquina superior izquierda; incluye elementostype: "text"para renderizar texto literal en la imagen. El modelo es sensible al orden de las claves; consulta la guía oficial en docs/prompting.md.
- Pega lenguaje natural o, para mejores resultados, una leyenda JSON estructurada siguiendo el esquema de Ideogram 4. Usa
- Modo preajuste (velocidad vs calidad): grupo “Preset” dentro del subgrafo
- Elige un modo en la entrada
modedel subgrafo: Default (equilibrado), Quality (más pasos y fidelidad), o Turbo (menos pasos y retroalimentación más rápida). El flujo de trabajo analiza una pequeña tabla de preajustes internos y enruta la cantidad de pasos y parámetros de programación correspondientes al programador. Cambia preajustes para iterar rápidamente, luego termina con mayor calidad.
- Elige un modo en la entrada
- Muestreo y guía: grupo “Sampling” dentro del subgrafo
- La canalización utiliza muestreo de coincidencia de flujo con una rama incondicional emparejada para guía libre de clasificador asimétrica. El
DualModelGuidercombina predicciones condicionales e incondicionales, mientras queIdeogram4Schedulerda forma al programa de ruido para tu tamaño y preajuste elegido.KSamplerSelectelige el algoritmo ySamplerCustomAdvancedejecuta la pasada de desruido antes de decodificar.
- La canalización utiliza muestreo de coincidencia de flujo con una rama incondicional emparejada para guía libre de clasificador asimétrica. El
- Modelos (preconectados): grupo “Models” dentro del subgrafo
- El gráfico carga el modelo principal Ideogram 4, su pareja incondicional, el codificador de texto Qwen3-VL, y el FLUX.2 VAE. Estos están conectados al guía, muestreador y decodificador. Normalmente no necesitas cambiar estos, pero cambiar modelos es posible si estás experimentando con variantes empaquetadas para ComfyUI.
- Opcional: redacción JSON en el gráfico:
JSON Prompt Builder (Gemma4)(#134)- Selecciona el grupo “LLM Prompt Builder (Select and Ctrl+B to enable)” para activarlo. Ingresa una idea corta en el campo
user_prompt; el nodo redacta una leyenda JSON correcta en esquema que puedes previsualizar conPreviewAny(#111). Copia el JSON generado en la entrada principalpromptpara el subgrafo de imagen.
- Selecciona el grupo “LLM Prompt Builder (Select and Ctrl+B to enable)” para activarlo. Ingresa una idea corta en el campo
- Salida:
SaveImage(#158)- Las imágenes se escriben en una carpeta nombrada para la versión del modelo. Cambia el prefijo si deseas mantener salidas de diferentes preajustes o relaciones de aspecto separadas.
Nodos clave en el flujo de trabajo de Comfyui Ideogram 4 ComfyUI#
CLIP Text Encode (Positive Prompt)(#24)- Codifica la indicación con Qwen3-VL para Ideogram 4. Usa JSON estructurado para control de diseño, texto explícito en la imagen y dirección de paleta. Mantén el orden de las claves estable y usa
[y_min, x_min, y_max, x_max]con valores en una cuadrícula de 0–1000 para entradasbbox; esto coincide con el esquema documentado del modelo en docs/prompting.md.
- Codifica la indicación con Qwen3-VL para Ideogram 4. Usa JSON estructurado para control de diseño, texto explícito en la imagen y dirección de paleta. Mantén el orden de las claves estable y usa
UNETLoader(#23)- Carga el punto de control principal de Ideogram 4 que realiza desruido condicional. Este es el soporte que traduce tu leyenda codificada en imágenes; déjalo como la versión oficial para los resultados más consistentes: ideogram-ai/ideogram-4-fp8.
UNETLoader(#154)- Carga el punto de control incondicional de Ideogram 4 utilizado para guía libre de clasificador asimétrica. Emparejar esto con el modelo principal permite que el guía controle la adherencia a la indicación y la calidad general de la imagen por separado: Comfy-Org/Ideogram-4.
DualModelGuider(#155)- Combina predicciones condicionales e incondicionales para implementar guía libre de clasificador asimétrica. Ajusta la fuerza de la guía solo si entiendes el compromiso: demasiado poco debilita la fidelidad de la indicación; demasiado puede agudizar o distorsionar en exceso. Al cambiar preajustes, revisa la guía para mantener una "sensación" similar.
Ideogram4Scheduler(#17)- Produce el programa de ruido y la cantidad de pasos especializados para Ideogram 4 en tu ancho y alto elegidos. El grupo “Preset” le proporciona los pasos y parámetros de programación coincidentes; usa Quality para renders finales, Turbo para borradores, y Default para trabajo diario.
SamplerCustomAdvanced(#12)- Ejecuta la pasada de desruido utilizando el muestreador seleccionado y las
sigmasdel programador. Déjalo sin cambios a menos que estés comparando intencionalmente familias de muestreadores; si intercambias muestreadores, mantén fija la resolución y el preajuste para que las comparaciones A/B sean significativas.
- Ejecuta la pasada de desruido utilizando el muestreador seleccionado y las
CFGOverride(#157)- Proporciona un control fino sobre cómo se aplica el condicionamiento durante el muestreo. La mayoría de los usuarios pueden ignorar esto y confiar en los preajustes; si lo ajustas, haz cambios pequeños y reevalúa en múltiples indicaciones para evitar sobreajustar el comportamiento del muestreador a una sola escena.
VAELoader(#9) yVAEDecode(#13)- Carga y aplica el FLUX.2 VAE para decodificar latentes muestreados en imágenes finales. Mantén el VAE oficial para preservar la colorimetría y el equilibrio de detalles a menos que estés probando alternativas: Comfy-Org/flux2-dev.
Extras opcionales#
- Usa elementos
type: "text"en tu JSON para renderizar el texto exacto en la imagen; mantén las cadenas concisas y colócalas con unbboxdedicado. - Comienza con 3–6 colores en
style_description.color_palette(hex en mayúsculas) y añade paletas por elemento solo cuando necesites anulaciones locales. - Para el diseño, piensa en tercios: varía los tamaños y posiciones de
bboxpara crear profundidad; las cajas no superpuestas reducen colisiones. - Bloquea la semilla de ruido para reproducir una composición; cámbiala para explorar variaciones sin alterar tu JSON.
- Si ves “Imagen bloqueada por filtro de seguridad,” esa respuesta proviene del modelo mismo; ajusta el contenido hacia indicaciones seguras y consistentes con el esquema. Para detalles completos, consulta la tarjeta del modelo: ideogram-ai/ideogram-4-fp8.
Agradecimientos#
Este flujo de trabajo implementa y se basa en los siguientes trabajos y recursos. Agradecemos a Comfy-Org por el anuncio de soporte del Día 0 de ComfyUI y la plantilla de flujo de trabajo para Ideogram 4, Comfy-Org por la tarjeta del modelo Ideogram-4, e ideogram-oss por el repositorio de código abierto de Ideogram 4 por sus contribuciones y mantenimiento. Para detalles autorizados, consulta la documentación original y los repositorios enlazados a continuación.
Recursos#
- Comfy-Org/Comfy blog announcement
- Documentos / Notas de Lanzamiento: Ideogram 4 Day 0 support in ComfyUI
- Comfy-Org/Comfy workflow template
- Comfy-Org/Ideogram 4 ComfyUI model card
- Hugging Face: Comfy-Org/Ideogram-4
- ideogram-oss/Ideogram 4 inference-code repository
- GitHub: ideogram-oss/ideogram4
Nota: El uso de los modelos, conjuntos de datos y código referenciados está sujeto a las respectivas licencias y términos proporcionados por sus autores y mantenedores.









