Ideogram 4 ComfyUI рабочий процесс: структурированный текст в изображение с точным макетом и типографикой#
Этот рабочий процесс Ideogram 4 ComfyUI — компактный, готовый для RunComfy шаблон для Ideogram 4.0, модели текста в изображение с открытыми весами, созданной для дизайна, контроля макета и надежного текста в изображении. Он превращает структурированные подписи JSON в изображения с краткими описаниями сцен, блоками стиля, нормализованными ограничивающими рамками и палитрами цветов в формате hex, что делает его идеальным для постеров, брендированных композиций, графики с акцентом на типографику и иллюстраций, осведомленных о макете.
График предоставляет чистый, одноцелевой конвейер текст в изображение плюс дополнительный построитель подсказок JSON на графике. Если вы уже пишете подсказки JSON, вставьте их и сразу же рендерьте; если вы предпочитаете начать с короткой идеи, помощник LLM может составить схему‑корректную подпись, которую вы можете просмотреть и вставить в генератор. Под капотом рабочий процесс следует потоку Ideogram 4 с выборкой DiT, соответствующей потоку, с асимметричным управлением без классификатора.
Ключевые модели в Comfyui Ideogram 4 ComfyUI рабочем процессе#
- Ideogram 4 (FP8). 9.3B-параметрический Diffusion Transformer, обученный с согласованием потока, разработанный для генерации, управляемой JSON, сильного рендеринга текста и явного контроля макета. Официальная карточка модели: ideogram-ai/ideogram-4-fp8. Код для вывода: ideogram-oss/ideogram4.
- Безусловная ветвь Ideogram 4. Парная контрольная точка без условий, используемая для асимметричного управления без классификатора при выборке; поставляется для ComfyUI вместе с основной моделью: Comfy-Org/Ideogram-4.
- Qwen3‑VL‑8B‑Instruct (FP8). Кодировщик зрение‑язык, используемый в качестве текстового кодировщика, предоставляющий многоуровневые семантические особенности из подсказки: Qwen/Qwen3-VL-8B-Instruct-FP8 (репак ComfyUI: Comfy-Org/Qwen3-VL).
- FLUX.2 VAE. Декодер, используемый для преобразования выборок латентов в конечные изображения, поставляется для ComfyUI: Comfy-Org/flux2-dev.
Как использовать Comfyui Ideogram 4 ComfyUI рабочий процесс#
Общая логика: выберите холст, предоставьте подсказку (желательно структурированный JSON), выберите предустановку сэмплера (Default, Quality, Turbo), затем рендерьте. Основной подграф “Text to Image (Ideogram v4)” выполняет кодирование, руководство, сэмплирование и декодирование за один проход; дополнительная группа “LLM Prompt Builder” может составлять JSON для вас.
- Холст и соотношение сторон:
ResolutionSelector(#37)- Выберите предустановку, такую как 1:1, 16:9 или 9:16. Рабочий процесс вычисляет допустимые размеры для Ideogram 4 (кратные 16 с разумными минимальными значениями) и передает их сэмплеру и VAE. Это позволяет вам нацеливать всё от квадратных миниатюр до высоких постеров без ручных вычислений. Изменяйте в любое время; планировщик адаптируется к выбранному вами разрешению.
- Подсказка и подпись JSON:
CLIP Text Encode (Positive Prompt)(#24)- Вставьте естественный язык или, для лучших результатов, структурированную подпись JSON, соответствующую схеме Ideogram 4. Используйте
high_level_description, блокstyle_description(сcolor_paletteв виде заглавных hex кодов) и секциюcompositional_deconstruction. Ограничивающие рамки нормализуются на сетке 0–1000 с порядком[y_min, x_min, y_max, x_max]и началом в верхнем левом углу; включите элементыtype: "text", чтобы отобразить буквальный текст в изображении. Модель чувствительна к порядку ключей; см. официальное руководство в docs/prompting.md.
- Вставьте естественный язык или, для лучших результатов, структурированную подпись JSON, соответствующую схеме Ideogram 4. Используйте
- Режим предустановки (скорость против качества): группа “Preset” внутри подграфа
- Выберите режим во входе
modeподграфа: Default (сбалансированный), Quality (больше шагов и точности), или Turbo (меньше шагов и самое быстрое обратное сообщение). Рабочий процесс анализирует небольшую внутреннюю таблицу предустановок и направляет соответствующее количество шагов и параметры расписания к планировщику. Переключайте предустановки для быстрой итерации, затем завершайте на более высоком качестве.
- Выберите режим во входе
- Сэмплирование и руководство: группа “Sampling” внутри подграфа
- Конвейер использует сэмплирование, соответствующее потоку, с парной безусловной ветвью для асимметричного управления без классификатора.
DualModelGuiderсмешивает условные и безусловные предсказания, в то время какIdeogram4Schedulerформирует график шума для выбранного вами размера и предустановки.KSamplerSelectвыбирает алгоритм, аSamplerCustomAdvancedвыполняет проход денойзинга перед декодированием.
- Конвейер использует сэмплирование, соответствующее потоку, с парной безусловной ветвью для асимметричного управления без классификатора.
- Модели (предварительно подключенные): группа “Models” внутри подграфа
- График загружает основную модель Ideogram 4, её безусловного партнера, текстовый кодировщик Qwen3‑VL и FLUX.2 VAE. Они подключены к руководителю, сэмплеру и декодеру. Обычно вам не нужно изменять их, но замена моделей возможна, если вы экспериментируете с вариантами, упакованными для ComfyUI.
- Дополнительно: составление JSON на графике:
JSON Prompt Builder (Gemma4)(#134)- Выберите группу “LLM Prompt Builder (Select and Ctrl+B to enable)”, чтобы включить её. Введите короткую идею в поле
user_prompt; узел составляет схему‑корректную подпись JSON, которую вы можете просмотреть с помощьюPreviewAny(#111). Скопируйте сгенерированный JSON в основной входpromptдля подграфа изображения.
- Выберите группу “LLM Prompt Builder (Select and Ctrl+B to enable)”, чтобы включить её. Введите короткую идею в поле
- Вывод:
SaveImage(#158)- Изображения сохраняются в папке, названной по версии модели. Переименуйте префикс, если хотите сохранить выходные данные от разных предустановок или соотношений сторон отдельно.
Ключевые узлы в Comfyui Ideogram 4 ComfyUI рабочем процессе#
CLIP Text Encode (Positive Prompt)(#24)- Кодирует подсказку с помощью Qwen3‑VL для Ideogram 4. Используйте структурированный JSON для контроля макета, явного текста в изображении и управления палитрой. Сохраняйте порядок ключей стабильным и используйте
[y_min, x_min, y_max, x_max]со значениями на сетке 0–1000 для записейbbox; это соответствует документированной схеме модели в docs/prompting.md.
- Кодирует подсказку с помощью Qwen3‑VL для Ideogram 4. Используйте структурированный JSON для контроля макета, явного текста в изображении и управления палитрой. Сохраняйте порядок ключей стабильным и используйте
UNETLoader(#23)- Загружает основную контрольную точку Ideogram 4, которая выполняет условный денойзинг. Это основа, которая переводит вашу закодированную подпись в изображения; оставьте её как официальную версию для наиболее последовательных результатов: ideogram-ai/ideogram-4-fp8.
UNETLoader(#154)- Загружает безусловную контрольную точку Ideogram 4, используемую для асимметричного управления без классификатора. Сочетание этого с основной моделью позволяет руководителю контролировать приверженность подсказке и общее качество изображения отдельно: Comfy-Org/Ideogram-4.
DualModelGuider(#155)- Комбинирует условные и безусловные предсказания для реализации асимметричного управления без классификатора. Настройте силу управления только если вы понимаете компромисс: слишком мало ослабляет точность подсказки; слишком много может переострить или исказить. При изменении предустановок пересмотрите руководство, чтобы сохранить аналогичное “ощущение.”
Ideogram4Scheduler(#17)- Создает график шума и количество шагов, специализированное для Ideogram 4 при выбранной вами ширине и высоте. Группа “Preset” подает ему соответствующие шаги и параметры расписания; используйте Quality для окончательных рендеров, Turbo для черновиков и Default для повседневной работы.
SamplerCustomAdvanced(#12)- Выполняет проход денойзинга, используя выбранный сэмплер и
sigmasпланировщика. Оставьте это неизмененным, если вы намеренно не сравниваете семейства сэмплеров; если вы все же меняете сэмплеры, держите разрешение и предустановку фиксированными, чтобы сделать A/B сравнения значимыми.
- Выполняет проход денойзинга, используя выбранный сэмплер и
CFGOverride(#157)- Обеспечивает тонкую настройку того, как применяется кондиционирование во время сэмплирования. Большинство пользователей могут игнорировать это и полагаться на предустановки; если вы настраиваете это, делайте небольшие изменения и переоценивайте на нескольких подсказках, чтобы избежать переоснащения поведения сэмплера к одной сцене.
VAELoader(#9) иVAEDecode(#13)- Загружают и применяют FLUX.2 VAE для декодирования выборок латентов в конечные изображения. Сохраняйте официальный VAE, чтобы сохранить цветопередачу и баланс деталей, если только вы не тестируете альтернативы: Comfy-Org/flux2-dev.
Дополнительные опции#
- Используйте элементы
type: "text"в вашем JSON, чтобы отобразить точную формулировку в изображении; держите строки краткими и размещайте их с выделеннойbbox. - Начните с 3–6 цветов в
style_description.color_palette(в верхнем регистре hex) и добавляйте палитры для отдельных элементов только тогда, когда вам нужны локальные переопределения. - Для макета думайте в трети: варьируйте размеры и позиции
bbox, чтобы создать глубину; не пересекающиеся рамки уменьшают коллизии. - Заблокируйте семя шума, чтобы воспроизвести композицию; измените его, чтобы исследовать вариации, не изменяя ваш JSON.
- Если вы видите “Изображение заблокировано фильтром безопасности,” этот ответ поступает от самой модели; измените содержание в сторону безопасных, согласованных со схемой подсказок. Для полной информации см. карточку модели: ideogram-ai/ideogram-4-fp8.
Признания#
Этот рабочий процесс реализует и основывается на следующих работах и ресурсах. Мы искренне благодарим Comfy-Org за объявление о поддержке ComfyUI Day 0 и шаблон рабочего процесса для Ideogram 4, Comfy-Org за карточку модели Ideogram-4 и ideogram-oss за открытый репозиторий Ideogram 4 за их вклад и поддержку. Для авторитетных подробностей, пожалуйста, обратитесь к оригинальной документации и репозиториям, указанным ниже.
Ресурсы#
- Comfy-Org/Comfy блог анонс
- Документация / Примечания к выпуску: Ideogram 4 Day 0 support in ComfyUI
- Comfy-Org/Comfy шаблон рабочего процесса
- Comfy-Org/Ideogram 4 ComfyUI карточка модели
- Hugging Face: Comfy-Org/Ideogram-4
- ideogram-oss/Ideogram 4 открытый репозиторий
- GitHub: ideogram-oss/ideogram4
Примечание: Использование указанных моделей, наборов данных и кода подлежит соответствующим лицензиям и условиям, предоставленным их авторами и поддерживающими.









