Этот рабочий процесс интегрирует Z Image Turbo в ComfyUI, чтобы вы могли создавать визуальные эффекты с высоким разрешением и фотореалистичностью с минимальными шагами и строгим соблюдением подсказок. Он разработан для создателей, которым нужны быстрые и стабильные рендеры для концепт-арта, рекламных композиций, интерактивных медиа и быстрого A/B тестирования.
График следует чистому пути от текстовых подсказок к изображению: он загружает модель Z Image и поддерживающие компоненты, кодирует положительные и отрицательные подсказки, создаёт латентный холст, выполняет выборку с помощью расписания AuraFlow, а затем декодирует в RGB для сохранения. Результат — упрощённый конвейер Z Image, который отдаёт предпочтение скорости без ущерба для деталей.
На высоком уровне путь проходит от подсказки к настройке, через выборку Z Image, затем декодируется в изображение. Узлы сгруппированы по этапам, чтобы упростить работу.
UNETLoader (#16), CLIPLoader (#18), VAELoader (#17)Этот этап загружает основной контрольный пункт Z Image Turbo, текстовый энкодер и автоэнкодер. Выберите контрольную точку BF16, если она у вас есть, так как она балансирует скорость и качество для потребительских GPU. Стильный энкодер CLIP обеспечивает, чтобы ваше формулирование управляло сценой и стилем. AE необходим для преобразования латентов обратно в RGB после завершения выборки.
CLIP Text Encode (Positive Prompt) (#6) и CLIP Text Encode (Negative Prompt) (#7)Напишите, что вы хотите, в положительной подсказке, используя конкретные существительные, стилистические подсказки, подсказки камеры и освещение. Используйте отрицательную подсказку, чтобы подавить общие артефакты, такие как размытие или нежелательные объекты. Если вы видите преамбулу подсказки, такую как заголовок инструкции из официального примера, вы можете оставить, отредактировать или удалить её, и рабочий процесс всё равно будет работать. Вместе эти энкодеры создают настройку, которая направляет Z Image во время выборки.
EmptySD3LatentImage (#13) и ModelSamplingAuraFlow (#11)Выберите размер вывода, установив латентный холст. Узел планировщика переключает модель на стратегию выборки в стиле AuraFlow, которая хорошо сочетается с дистиллированными моделями, эффективными по шагам. Это сохраняет стабильность траекторий при низком количестве шагов, сохраняя при этом мелкие детали. Как только холст и расписание установлены, конвейер готов к денойзингу.
KSampler (#3)Этот узел выполняет фактический денойзинг, используя загруженную модель Z Image, выбранный планировщик и вашу настройку подсказок. Настройте тип семплера и количество шагов, чтобы обменивать скорость на детали, когда это необходимо. Масштаб управления направлением регулирует силу подсказки относительно предыдущего; умеренные значения обычно обеспечивают лучший баланс между точностью и креативной вариацией. Рандомизируйте seed для исследования или зафиксируйте его для повторяемых результатов.
VAEDecode (#8) и SaveImage (#9)После выборки AE декодирует латенты в изображение. Узел сохранения записывает файлы в вашу выходную директорию, чтобы вы могли сравнивать итерации или передавать результаты в последующие задачи. Если вы планируете увеличивать масштаб или обрабатывать пост, держите декодирование на желаемом рабочем разрешении и экспортируйте в безубыточные форматы для лучшего сохранения качества.
UNETLoader (#16)Загружает контрольную точку Z Image Turbo (z_image_turbo_bf16.safetensors). Используйте это, чтобы переключаться между вариантами точности или обновлёнными весами, когда они становятся доступны. Держите модель последовательной на протяжении сессии, если вы хотите, чтобы seeds и подсказки оставались сопоставимыми. Изменение базовой модели изменит внешний вид, цветовую реакцию и плотность деталей.
ModelSamplingAuraFlow (#11)Устанавливает стратегию выборки на расписание в стиле AuraFlow, подходящее для быстрой сходимости. Это ключ к тому, чтобы сделать Z Image эффективным при низком количестве шагов, сохраняя детали и согласованность. Если вы позже смените расписания, пересмотрите количество шагов и руководство, чтобы поддерживать аналогичные характеристики вывода.
KSampler (#3)Контролирует алгоритм семплера, шаги, руководство и seed. Используйте меньше шагов для быстрого генерирования идей и увеличивайте только тогда, когда вам нужны более мелкие детали или более строгое соблюдение подсказок. Разные семплеры предпочитают разные виды; попробуйте пару и держите остальную часть конвейера фиксированной при сравнении результатов.
CLIP Text Encode (Positive Prompt) (#6)Кодирует творческий замысел, который движет Z Image. Сосредоточьтесь на предмете, среде, объективе, освещении, композиции и любых брендовых или дизайнерских ограничениях. Сочетайте с узлом негативной подсказки, чтобы направить изображение к вашей целевой внешности, отфильтровывая известные артефакты.
Этот рабочий процесс реализует и основывается на следующих работах и ресурсах. Мы благодарны Tongyi-MAI за Z-Image-Turbo за их вклад и поддержку. Для получения авторитетных подробностей, пожалуйста, обратитесь к оригинальной документации и репозиториям, указанным ниже.
Примечание: Использование упомянутых моделей, наборов данных и кода подчиняется соответствующим лицензиям и условиям, предоставленным их авторами и поддерживающими лицами.
RunComfy - ведущая ComfyUI платформа, предлагающая ComfyUI онлайн среду и услуги, а также рабочие процессы ComfyUI с потрясающей визуализацией. RunComfy также предоставляет AI Playground, позволяя художникам использовать новейшие инструменты AI для создания невероятного искусства.