Z Image Workflow в ComfyUI | Генерация в реальном времени с высоким разрешением

Z Image Turbo для ComfyUI: быстрый текст в изображение с почти мгновенной итерацией

Этот рабочий процесс интегрирует Z Image Turbo в ComfyUI, чтобы вы могли создавать визуальные эффекты с высоким разрешением и фотореалистичностью с минимальными шагами и строгим соблюдением подсказок. Он разработан для создателей, которым нужны быстрые и стабильные рендеры для концепт-арта, рекламных композиций, интерактивных медиа и быстрого A/B тестирования.

График следует чистому пути от текстовых подсказок к изображению: он загружает модель Z Image и поддерживающие компоненты, кодирует положительные и отрицательные подсказки, создаёт латентный холст, выполняет выборку с помощью расписания AuraFlow, а затем декодирует в RGB для сохранения. Результат — упрощённый конвейер Z Image, который отдаёт предпочтение скорости без ущерба для деталей.

Основные модели в рабочем процессе Comfyui Z Image

Tongyi-MAI Z Image Turbo. Основной генератор, выполняющий денойзинг в дистиллированной, эффективной по шагам манере. Он нацелен на фотореализм, чёткие текстуры и точную композицию, сохраняя низкую задержку. Model card
Qwen 4B text encoder (qwen_3_4b.safetensors). Обеспечивает языковую настройку модели, чтобы стиль, тема и композиция в вашей подсказке направляли траекторию денойзинга.
Autoencoder AE (ae.safetensors). Переводит между латентным пространством и пикселями, чтобы конечный результат Z Image можно было просматривать и экспортировать.

Как использовать рабочий процесс Comfyui Z Image

На высоком уровне путь проходит от подсказки к настройке, через выборку Z Image, затем декодируется в изображение. Узлы сгруппированы по этапам, чтобы упростить работу.

Загрузчики моделей: `UNETLoader` (#16), `CLIPLoader` (#18), `VAELoader` (#17)

Этот этап загружает основной контрольный пункт Z Image Turbo, текстовый энкодер и автоэнкодер. Выберите контрольную точку BF16, если она у вас есть, так как она балансирует скорость и качество для потребительских GPU. Стильный энкодер CLIP обеспечивает, чтобы ваше формулирование управляло сценой и стилем. AE необходим для преобразования латентов обратно в RGB после завершения выборки.

Подсказки: `CLIP Text Encode (Positive Prompt)` (#6) и `CLIP Text Encode (Negative Prompt)` (#7)

Напишите, что вы хотите, в положительной подсказке, используя конкретные существительные, стилистические подсказки, подсказки камеры и освещение. Используйте отрицательную подсказку, чтобы подавить общие артефакты, такие как размытие или нежелательные объекты. Если вы видите преамбулу подсказки, такую как заголовок инструкции из официального примера, вы можете оставить, отредактировать или удалить её, и рабочий процесс всё равно будет работать. Вместе эти энкодеры создают настройку, которая направляет Z Image во время выборки.

Латентность и планировщик: `EmptySD3LatentImage` (#13) и `ModelSamplingAuraFlow` (#11)

Выберите размер вывода, установив латентный холст. Узел планировщика переключает модель на стратегию выборки в стиле AuraFlow, которая хорошо сочетается с дистиллированными моделями, эффективными по шагам. Это сохраняет стабильность траекторий при низком количестве шагов, сохраняя при этом мелкие детали. Как только холст и расписание установлены, конвейер готов к денойзингу.

Выборка: `KSampler` (#3)

Этот узел выполняет фактический денойзинг, используя загруженную модель Z Image, выбранный планировщик и вашу настройку подсказок. Настройте тип семплера и количество шагов, чтобы обменивать скорость на детали, когда это необходимо. Масштаб управления направлением регулирует силу подсказки относительно предыдущего; умеренные значения обычно обеспечивают лучший баланс между точностью и креативной вариацией. Рандомизируйте seed для исследования или зафиксируйте его для повторяемых результатов.

Декодирование и сохранение: `VAEDecode` (#8) и `SaveImage` (#9)

После выборки AE декодирует латенты в изображение. Узел сохранения записывает файлы в вашу выходную директорию, чтобы вы могли сравнивать итерации или передавать результаты в последующие задачи. Если вы планируете увеличивать масштаб или обрабатывать пост, держите декодирование на желаемом рабочем разрешении и экспортируйте в безубыточные форматы для лучшего сохранения качества.

Ключевые узлы в рабочем процессе Comfyui Z Image

`UNETLoader` (#16)

Загружает контрольную точку Z Image Turbo (z_image_turbo_bf16.safetensors). Используйте это, чтобы переключаться между вариантами точности или обновлёнными весами, когда они становятся доступны. Держите модель последовательной на протяжении сессии, если вы хотите, чтобы seeds и подсказки оставались сопоставимыми. Изменение базовой модели изменит внешний вид, цветовую реакцию и плотность деталей.

`ModelSamplingAuraFlow` (#11)

Устанавливает стратегию выборки на расписание в стиле AuraFlow, подходящее для быстрой сходимости. Это ключ к тому, чтобы сделать Z Image эффективным при низком количестве шагов, сохраняя детали и согласованность. Если вы позже смените расписания, пересмотрите количество шагов и руководство, чтобы поддерживать аналогичные характеристики вывода.

`KSampler` (#3)

Контролирует алгоритм семплера, шаги, руководство и seed. Используйте меньше шагов для быстрого генерирования идей и увеличивайте только тогда, когда вам нужны более мелкие детали или более строгое соблюдение подсказок. Разные семплеры предпочитают разные виды; попробуйте пару и держите остальную часть конвейера фиксированной при сравнении результатов.

`CLIP Text Encode (Positive Prompt)` (#6)

Кодирует творческий замысел, который движет Z Image. Сосредоточьтесь на предмете, среде, объективе, освещении, композиции и любых брендовых или дизайнерских ограничениях. Сочетайте с узлом негативной подсказки, чтобы направить изображение к вашей целевой внешности, отфильтровывая известные артефакты.

Дополнительные возможности

Используйте квадратные или близкие к квадратным разрешения для первого прохода, затем корректируйте соотношение сторон, когда композиция зафиксирована.
Держите библиотеку повторно используемых фрагментов подсказок для тем, объективов и освещения, чтобы ускорить итерацию по проектам.
Для последовательного художественного направления зафиксируйте seed и изменяйте только один фактор за итерацию, например, тег стиля или подсказку камеры.
Если выходы кажутся чрезмерно контролируемыми, немного уменьшите руководство или удалите слишком предписывающие фразы из положительной подсказки.
При подготовке активов для последующего редактирования экспортируйте безубыточные PNG и сохраняйте запись подсказки, seed и разрешения вместе с каждым рендером Z Image.

Благодарности

Этот рабочий процесс реализует и основывается на следующих работах и ресурсах. Мы благодарны Tongyi-MAI за Z-Image-Turbo за их вклад и поддержку. Для получения авторитетных подробностей, пожалуйста, обратитесь к оригинальной документации и репозиториям, указанным ниже.

Ресурсы

Tongyi-MAI/Z-Image-Turbo
- Hugging Face: Tongyi-MAI/Z-Image-Turbo

Примечание: Использование упомянутых моделей, наборов данных и кода подчиняется соответствующим лицензиям и условиям, предоставленным их авторами и поддерживающими лицами.

Want More ComfyUI Workflows?

Wan 2.1 | Революционное создание видео

Создавайте невероятные видео из текста или изображений с прорывным ИИ, работающим на повседневных ЦП.

Wan 2.1 LoRA

Улучшите генерацию видео Wan 2.1 с помощью моделей LoRA для улучшенного стиля и кастомизации.

Wan 2.1 Control LoRA | Глубина и Плитка

Усовершенствуйте генерацию видео Wan 2.1 с помощью легких глубинных и плиточных LoRA для улучшения структуры и деталей.

Wan 2.1 Fun | Генерация Видео ControlNet

Создавайте видео с визуальными проходами в стиле ControlNet, такими как Depth, Canny и OpenPose.

Wan 2.1 Видео Перестиль | Единообразное Преобразование Стиля Видео

Преобразуйте стиль вашего видео, применив перестиль первого кадра с помощью рабочей схемы Wan 2.1 видео перестиль.

CatVTON | Удивительная виртуальная примерка

CatVTON для легкой и точной виртуальной примерки.

Эффекты анимации графики | Vid2Vid

Достигните эффектов анимации графики, начиная с уже существующего видео.

FLUX Расширение изображения

Используйте SDXL и FLUX для бесшовного расширения и улучшения изображений.

Подписывайтесь на нас

Поддержка

Ресурсы

Юридическая информация

RunComfy

RunComfy - ведущая ComfyUI платформа, предлагающая ComfyUI онлайн среду и услуги, а также рабочие процессы ComfyUI с потрясающей визуализацией. RunComfy также предоставляет AI Models, позволяя художникам использовать новейшие инструменты AI для создания невероятного искусства.

Z Image | Ультрабыстрый фотореалистичный генератор

Z Image Turbo для ComfyUI: быстрый текст в изображение с почти мгновенной итерацией

Основные модели в рабочем процессе Comfyui Z Image

Как использовать рабочий процесс Comfyui Z Image

Загрузчики моделей: UNETLoader (#16), CLIPLoader (#18), VAELoader (#17)

Подсказки: CLIP Text Encode (Positive Prompt) (#6) и CLIP Text Encode (Negative Prompt) (#7)

Латентность и планировщик: EmptySD3LatentImage (#13) и ModelSamplingAuraFlow (#11)

Выборка: KSampler (#3)

Декодирование и сохранение: VAEDecode (#8) и SaveImage (#9)

Ключевые узлы в рабочем процессе Comfyui Z Image

UNETLoader (#16)

ModelSamplingAuraFlow (#11)

KSampler (#3)

CLIP Text Encode (Positive Prompt) (#6)

Дополнительные возможности

Благодарности

Ресурсы

Want More ComfyUI Workflows?

Wan 2.1 | Революционное создание видео

Wan 2.1 LoRA

Wan 2.1 Control LoRA | Глубина и Плитка

Wan 2.1 Fun | Генерация Видео ControlNet

Wan 2.1 Видео Перестиль | Единообразное Преобразование Стиля Видео

CatVTON | Удивительная виртуальная примерка

Эффекты анимации графики | Vid2Vid

FLUX Расширение изображения

Загрузчики моделей: `UNETLoader` (#16), `CLIPLoader` (#18), `VAELoader` (#17)

Подсказки: `CLIP Text Encode (Positive Prompt)` (#6) и `CLIP Text Encode (Negative Prompt)` (#7)

Латентность и планировщик: `EmptySD3LatentImage` (#13) и `ModelSamplingAuraFlow` (#11)

Выборка: `KSampler` (#3)

Декодирование и сохранение: `VAEDecode` (#8) и `SaveImage` (#9)

`UNETLoader` (#16)

`ModelSamplingAuraFlow` (#11)

`KSampler` (#3)

`CLIP Text Encode (Positive Prompt)` (#6)