logo
RunComfy
ComfyUIPlaygroundPricing
discord logo
ComfyUI>Рабочие процессы>Z Image ControlNet | Генератор точных изображений

Z Image ControlNet | Генератор точных изображений

Workflow Name: RunComfy/Z-Image-ControlNet
Workflow ID: 0000...1319
Этот рабочий процесс помогает создавать точно контролируемые изображения с использованием справочного руководства благодаря Z Image ControlNet. Вы можете создавать композиции, используя края, глубину или человеческие позы, чтобы определить структуру и макет. Это идеально подходит для концептуальных художников, дизайнеров и фотографов, которым нужна точная форма и пространственная согласованность. Процесс сочетает в себе текстовые и визуальные подсказки для получения богатых, фотореалистичных результатов. Наслаждайтесь быстрой интерпретацией, разнообразными вариантами управления и стабильными, повторяемыми результатами в каждом рендере.

Рабочий процесс Z Image ControlNet для генерации изображений с учетом структуры в ComfyUI

Этот рабочий процесс привносит Z Image ControlNet в ComfyUI, чтобы вы могли управлять Z‑Image Turbo с точной структурой из справочных изображений. Он объединяет три режима управления в одном графе: глубина, края canny и человеческая поза, и позволяет переключаться между ними в зависимости от вашей задачи. Результат — быстрая, высококачественная генерация текста или изображения в изображение, где макет, поза и композиция остаются под контролем, пока вы итеративно работаете.

Разработан для художников, концептуальных дизайнеров и планировщиков макетов, график поддерживает двуязычные подсказки и необязательный стиль LoRA. Вы получаете чистый предварительный просмотр выбранного управляющего сигнала плюс автоматическую полосу сравнения для оценки глубины, краев canny или позы по сравнению с конечным результатом.

Ключевые модели в рабочем процессе Comfyui Z Image ControlNet

  • Модель диффузии Z‑Image Turbo с 6B параметрами. Основной генератор, который быстро создает фотореалистичные изображения из подсказок и управляющих сигналов. alibaba-pai/Z-Image-Turbo
  • Патч Z Image ControlNet Union. Добавляет многоконтурное управление в Z‑Image Turbo и позволяет управление глубиной, краями и позой в одном патче модели. alibaba-pai/Z-Image-Turbo-Fun-Controlnet-Union
  • Depth Anything v2. Создает плотные карты глубины, используемые для управления структурой в режиме глубины. LiheYoung/Depth-Anything-V2 на GitHub
  • DWPose. Оценивает ключевые точки человека и позу тела для генерации, управляемой позой. IDEA-Research/DWPose
  • Детектор краев Canny. Извлекает чистое линейное искусство и границы для управления, основанного на макете.
  • Вспомогательные препроцессоры ControlNet для ComfyUI. Предоставляет унифицированные обертки для глубины, краев и поз, используемых в этом графике. comfyui_controlnet_aux

Как использовать рабочий процесс Comfyui Z Image ControlNet

На высоком уровне вы загружаете или загружаете справочное изображение, выбираете один режим управления из глубины, canny или позы, затем генерируете с текстовой подсказкой. График масштабирует справочное изображение для эффективной выборки, создает латентное изображение с подходящим соотношением сторон и сохраняет как конечное изображение, так и полосу сравнения.

Входные данные

Используйте LoadImage (#14) для выбора справочного изображения. Введите свою текстовую подсказку в Text Multiline (#17) стэк Z‑Image поддерживает двуязычные подсказки. Подсказка кодируется CLIPLoader (#2) и CLIPTextEncode (#4). Если вы предпочитаете полностью управление изображением в изображение, вы можете оставить подсказку минимальной и полагаться на выбранный управляющий сигнал.

Трехсторонний выбор ControlNet

Три препроцессора преобразуют ваше справочное изображение в управляющие сигналы. AIO_Preprocessor (#45) создает глубину с Depth Anything v2, AIO_Preprocessor (#46) извлекает края canny, а DWPreprocessor (#56) оценивает полную позу тела. Используйте ImpactSwitch (#58), чтобы выбрать, какой сигнал управляет Z Image ControlNet, и проверьте PreviewImage (#43), чтобы подтвердить выбранную управляющую карту. Выберите глубину, когда вам нужна геометрия сцены, canny для четкого макета или продуктовых фото, а позу для работы с персонажами.

Советы для OpenPose:

  1. Лучше для всего тела: OpenPose работает лучше (~70-90% точности), когда вы включаете "всё тело" в вашу подсказку.
  2. Избегайте для крупного плана: Точность значительно падает на лицах. Используйте Depth или Canny (низкой/средней силы) для крупного плана вместо этого.
  3. Подсказки важны: Подсказки сильно влияют на ControlNet. Избегайте пустых подсказок, чтобы предотвратить размытые результаты.

Увеличение

ImageScaleToTotalPixels (#34) изменяет размер справочного изображения до практического рабочего разрешения для баланса качества и скорости. GetImageSizeAndCount (#35) считывает масштабированный размер и передает ширину и высоту вперед. EmptyLatentImage (#6) создает латентное изображение, соответствующее соотношению сторон вашего измененного входного изображения, чтобы композиция оставалась согласованной.

Выходные данные

QwenImageDiffsynthControlnet (#39) объединяет базовую модель с патчем Z Image ControlNet union и выбранным управляющим изображением, затем KSampler (#7) генерирует результат, управляемый вашей положительной и отрицательной настройкой. VAEDecode (#8) преобразует латентное изображение в изображение. Рабочий процесс сохраняет два вывода: SaveImage (#31) записывает конечное изображение, а SaveImage (#42) записывает полосу сравнения через ImageConcatMulti (#38), которая включает источник, управляющую карту и результат для быстрой проверки качества.

Ключевые узлы в рабочем процессе Comfyui Z Image ControlNet

ImpactSwitch (#58)

Выбирает, какое управляющее изображение управляет генерацией глубины, краев или позы. Переключайте режимы, чтобы сравнить, как каждое ограничение формирует композицию и детали. Используйте его при итерации макетов, чтобы быстро протестировать, какое руководство лучше всего соответствует вашей цели.

QwenImageDiffsynthControlnet (#39)

Соединяет базовую модель, патч Z Image ControlNet union, VAE и выбранный управляющий сигнал. Параметр strength определяет, насколько строго модель следует управляющему вводу по сравнению с подсказкой. Для точного соответствия макету увеличьте силу для более творческих вариаций, уменьшите её.

AIO_Preprocessor (#45)

Запускает конвейер Depth Anything v2 для создания плотных карт глубины. Увеличьте разрешение для более детализированной структуры или уменьшите для более быстрых предварительных просмотров. Хорошо сочетается с архитектурными сценами, продуктовыми фото и пейзажами, где важна геометрия.

DWPreprocessor (#56)

Создает карты поз, подходящие для людей и персонажей. Лучше всего работает, когда конечности видны и не сильно скрыты. Если руки или ноги отсутствуют, попробуйте более четкую справочную или другой кадр с более полной видимостью тела.

LoraLoaderModelOnly (#54)

Применяет необязательный LoRA к базовой модели для стиля или идентификационных сигналов. Настройте strength_model, чтобы плавно или сильно смешать LoRA. Вы можете заменить лицо LoRA, чтобы персонализировать объекты, или использовать стиль LoRA, чтобы закрепить определенный вид.

KSampler (#7)

Выполняет диффузионную выборку, используя вашу подсказку и управление. Настройте seed для воспроизводимости, steps для бюджета уточнения, cfg для соответствия подсказке и denoise для того, насколько вывод может отклоняться от начального латентного. Для редактирования изображения в изображение уменьшите denoise для сохранения структуры, более высокие значения позволяют более крупные изменения.

Необязательные дополнения

  • Чтобы ужесточить композицию, используйте режим глубины с чистым, равномерно освещенным справочным изображением; canny предпочитает сильный контраст, а поза предпочитает полные снимки тела.
  • Для тонких правок из исходного изображения держите denoise умеренным и увеличьте силу ControlNet для верной структуры.
  • Увеличьте целевые пиксели в группе увеличения, когда вам нужно больше деталей, затем снова уменьшите для быстрого черновика.
  • Используйте выход сравнения для быстрого A/B тестирования глубины против canny против позы и выберите наиболее надежное управление для вашего объекта.
  • Замените пример LoRA на своё собственное лицо или стиль LoRA, чтобы включить идентичность или художественное направление без повторного обучения.

Благодарности

Этот рабочий процесс реализует и строится на следующих работах и ресурсах. Мы с благодарностью признаем Alibaba PAI за Z Image ControlNet за их вклад и поддержку. Для получения авторитетной информации, пожалуйста, обратитесь к оригинальной документации и репозиториям, приведенным ниже.

Ресурсы

  • Alibaba PAI/Z Image ControlNet
    • Hugging Face: alibaba-pai/Z-Image-Turbo-Fun-Controlnet-Union

Примечание: Использование упомянутых моделей, наборов данных и кода подчиняется соответствующим лицензиям и условиям, предоставленным их авторами и поддерживающими.

Want More ComfyUI Workflows?

Flux Consistent Characters | Input Image

Flux Consistent Characters | Input Image

Создавайте последовательных персонажей и обеспечивайте их единообразный вид, используя ваши изображения.

FLUX ControlNet Depth-V3 и Canny-V3

Достигайте лучшего контроля с FLUX-ControlNet-Depth и FLUX-ControlNet-Canny для FLUX.1 [dev].

FLUX LoRA (RealismLoRA) | Фотореалистичные изображения

FLUX LoRA (RealismLoRA) | Фотореалистичные изображения

Смешивайте модель FLUX-1 с FLUX-RealismLoRA для фотореалистичных изображений AI

FLUX Controlnet Inpainting

Улучшите реализм, используя ControlNet для управления FLUX.1-dev.

Создатель Постоянного Персонажа

Создавайте постоянные, высококачественные дизайны персонажей с разных углов с полным контролем над эмоциями, освещением и окружением.

MMAudio | Видео-в-Аудио

MMAudio: Продвинутая модель видео-в-аудио для высококачественной генерации аудио.

InstantID | Портреты в искусство

InstantID | Портреты в искусство

InstantID точно улучшает и трансформирует портреты с эстетической привлекательностью.

ControlNet Tile + 4x UltraSharp | Повышение разрешения изображений/видео

Используйте ControlNet Tile, 4xUltraSharp и интерполяцию кадров для получения высококачественного результата.

Подписывайтесь на нас
  • LinkedIn
  • Facebook
  • Instagram
  • Twitter
Поддержка
  • Discord
  • Email
  • Статус системы
  • партнёр
Ресурсы
  • Бесплатный ComfyUI онлайн
  • Руководства по ComfyUI
  • RunComfy API
  • ComfyUI Уроки
  • ComfyUI Узлы
  • Узнать больше
Юридическая информация
  • Условия обслуживания
  • Политика конфиденциальности
  • Политика в отношении файлов cookie
RunComfy
Авторское право 2025 RunComfy. Все права защищены.

RunComfy - ведущая ComfyUI платформа, предлагающая ComfyUI онлайн среду и услуги, а также рабочие процессы ComfyUI с потрясающей визуализацией. RunComfy также предоставляет AI Playground, позволяя художникам использовать новейшие инструменты AI для создания невероятного искусства.