Z-Image I2I Ultimate Photorealism в ComfyUI

ComfyUI Z-Image I2I Ultimate Photorealism Workflow

Z-Image I2I Ultimate Photorealism in ComfyUI | Identity-True Retouching

Want to run this workflow?

Fully operational workflows
No missing nodes or models
No manual setups required
Features stunning visuals

ComfyUI Z-Image I2I Ultimate Photorealism Examples

z-image-i2i-ultimate-photorealism-in-comfyui-identity-true-retouching-1340-example_01.webp

z-image-i2i-ultimate-photorealism-in-comfyui-identity-true-retouching-1340-example_02.webp

Z-Image I2I Ultimate Photorealism: безопасное для идентичности уточнение лица на портретах#

Z-Image I2I Ultimate Photorealism — это двухэтапный рабочий процесс ComfyUI для верного улучшения портретов image-to-image. Он сохраняет идентичность и общий внешний вид субъекта, добавляя реалистичные детали лица, корректируя выражение и избегая странных артефактов, характерных для замены лиц. Построенный вокруг Z-Image Turbo со специализированным руководством LoRA для лица, он идеально подходит для фотореалистичного редактирования портретов, ретуши и улучшений с сохранением идентичности из одного исходного изображения.

Конвейер сначала воспроизводит ваше входное фото с высокой точностью, затем избирательно улучшает лицо с помощью автоматического маскирования лица и осведомленного о выражении заполнения. Результат — это натуральный, реалистичный портрет, который сохраняет основное сходство. Этот README объясняет, как запустить и адаптировать рабочий процесс ComfyUI Z-Image I2I Ultimate Photorealism.

Примечание: для работы этого рабочего процесса требуется LoRA для лица. Загрузите свой собственный LoRA персонажа в узел группы Inputs Character Lora here.

Ключевые модели в рабочем процессе ComfyUI Z-Image I2I Ultimate Photorealism#

Модель диффузии Z-Image Turbo. Основной генератор image-to-image, который воспроизводит исходную композицию и освещение, позволяя при этом тонкие, фотореалистичные улучшения.
ZImageTurbo VAE. Парный кодировщик/декодер для верного латентного преобразования, который минимизирует цветовые и контрастные отклонения в I2I.
Адаптеры Face LoRA. Дополнительные LoRA для конкретных субъектов, которые усиливают черты идентичности без введения стилизации.
Семейство Qwen3-VL Instruct. Используется для автоматического описания выражения лица и взгляда, чтобы улучшения соответствовали тому, что действительно на фото. См. карточки моделей для Qwen3-VL-2B-Instruct и Qwen3-VL-4B-Instruct. Интеграция узла ComfyUI предоставлена ComfyUI-QwenVL.
Модель сегментации Anything Model 3 (SAM3). Сегментация с открытым словарем, которая изолирует область лица от базового прохода для точного, неразрушающего заполнения. См. facebookresearch/sam3 и обертку ComfyUI ComfyUI-SAM3.

Как использовать рабочий процесс ComfyUI Z-Image I2I Ultimate Photorealism#

Рабочий процесс выполняется в двух скоординированных этапах: базовый I2I-рендер, который верно воспроизводит ваше изображение, за которым следует проход улучшения только лица, управляемый автоматическим маскированием и осведомленным о выражении запросом. Отдельная песочница позволяет тестировать LoRA лиц без изменения исходного изображения.

Входные данные#

Загрузите свой портрет в LoadImage (#958). Изображение нормализуется с помощью ImageResizeKJv2 (#973) до стабильного рабочего размера, сохраняя композицию. Узел vision-language затем генерирует структурированный, фотодостоверный положительный запрос из изображения; длинная авто-запрос поступает из AILab_QwenVL (#962), который предназначен для описания того, что на фото, а не для изобретения нового контента. Вы можете оставить это как есть для редактирования с сохранением идентичности или заменить его своим собственным запросом для творческих вариаций. Текстовый кодировщик на основе GGUF предоставляет встраивания запросов, так что вы получаете согласованное кондиционирование даже в средах с низким VRAM.

Рендер#

Базовый проход воссоздает входное фото как чистую, деноизированную отправную точку. CLIPTextEncode (#6) кодирует авто-запрос, CLIPTextEncode (#7) добавляет отрицательный запрос безопасности, а SeedVarianceEnhancer (#978) вводит небольшое, контролируемое количество вариации на ранних этапах, чтобы избежать низкого разнообразия семян, характерного для турбо-моделей. Исходное изображение кодируется с помощью VAEEncode (#960), и основной семплер ClownsharKSampler_Beta (#979) создает высококачественный латент, который декодируется в предварительно улучшенное изображение через VAEDecode (#860). Этот промежуточный результат сохраняется как “Output 1 Pre-Face Detail” для быстрого сравнения A/B.

Улучшение лица#

Этап улучшения обнаруживает и улучшает только лицо, оставляя волосы, одежду и фон нетронутыми. LoadSAM3Model (#940) с SAM3Grounding (#939) находит точную маску лица из предварительно улучшенного изображения, используя текстовый запрос “лицо.” Маска смягчается с помощью GrowMaskWithBlur (#1008), а область лица обрезается в контексте с помощью InpaintCropImproved (#942) для более быстрого, высококачественного семплирования перед сшиванием назад. Второй AILab_QwenVL (#975) создает компактное описание, сосредоточенное только на выражении и взгляде, которое CLIPTextEncode (#944) превращает в положительное кондиционирование, в то время как ConditioningZeroOut (#945) намеренно обнуляет отрицательный канал, чтобы предотвратить излишнее подавление микродеталей лица. InpaintModelConditioning (#943) подготавливает замаскированные латенты; DifferentialDiffusion (#949) подталкивает модель к структурной согласованности; ClownsharKSampler_Beta (#985) заполняет улучшенное лицо; VAEDecode (#947) и InpaintStitchImproved (#950) объединяют улучшенное лицо обратно, не изменяя незамаскированные области. Финальное изображение сохраняется с помощью SaveImage (#989).

Тестирование LoRA#

Используйте песочницу “Test Lora” для оценки LoRA лица без изменения вашего источника. CLIPTextEncode (#999, #1000) предоставляет простую тестовую пару запросов, EmptyLatentImage (#1001) создает чистый холст, а ClownsharKSampler_Beta (#1007) рендерит быстрые образцы, которые вы можете просмотреть. Это полезно для настройки выбора и веса LoRA перед запуском полного прохода улучшения идентичности.

Ключевые узлы в рабочем процессе ComfyUI Z-Image I2I Ultimate Photorealism#

SAM3Grounding (#939). Обнаруживает лицо из текстового запроса на естественном языке с помощью SAM3, создавая чистые маски, устойчивые к перекрытиям и позам. Если маска слишком плотная или включает артефакты линии волос, осторожно расширьте или размыть её выше по потоку с помощью GrowMaskWithBlur, чтобы избежать швов. Справка: facebookresearch/sam3 и ComfyUI-SAM3.
InpaintCropImproved (#942) и InpaintStitchImproved (#950). Рабочий процесс обрезки и сшивания, который семплирует только замаскированную область с оптимальным разрешением, затем смешивает результат обратно в оригинал. Используйте его для установки целевого разрешения лица и контекста, при этом гарантируя, что незамаскированные пиксели никогда не перекодируются. Справка: ComfyUI-Inpaint-CropAndStitch.
ClownsharKSampler_Beta (#979, #985). Продвинутый семплер RES4LYF с высокоточной явной выборкой и надежными опциями SDE, которые отлично подходят для фотореалистичного I2I и заполнения. Для работы, критичной к идентичности, выберите стабильный семплер RES и консервативное снижение шума; увеличьте шум, только если вы собираетесь значительно изменить выражение или детали кожи. Справка: RES4LYF.
SeedVarianceEnhancer (#978). Добавляет контролируемый шум к положительным встраиваниям на ранних этапах, чтобы противодействовать низкому разнообразию семян в Z-Image Turbo, обеспечивая естественное разнообразие без отклонения идентичности. Увеличьте его силу, когда результаты выглядят слишком похожими на разных семенах; уменьшите, если ослабляется соответствие запросу. Справка: ChangeTheConstants/SeedVarianceEnhancer.
DifferentialDiffusion (#949). Модифицирует модель для дифференциального снижения шума, что помогает сохранить основную структуру во время замаскированных редактирований. Держите его включенным для тонких, безопасных для идентичности уточнений лица; рассмотрите возможность отключения, если вы намеренно хотите более сильные стилистические изменения. Справка: поведение узла задокументировано в экосистемах ComfyUI и используется здесь как средство сохранения структуры.
AILab_QwenVL (#962, #975). Запросы vision-language, которые читают фактическое содержимое изображения, чтобы сохранить руководство, привязанное к реальности, особенно для микро-выражений и направления взгляда. Предпочитайте краткие, буквальные формулировки в проходе лица, чтобы избежать введения новых атрибутов. Справка: ComfyUI-QwenVL и карточки моделей Qwen3-VL (2B, 4B).

Дополнительные возможности#

Используйте изображение “Output 1 Pre-Face Detail”, чтобы проверить базовую точность перед улучшением лица; это помогает отделить проблемы базового снижения шума от настроек маски или заполнения.
Если улучшенное лицо кажется слишком сглаженным, слегка расширьте маску лица и уменьшите её размытие, чтобы увеличить учёт краёв, затем выполните только проход лица.
Держите запросы фактическими для редактирования с сохранением идентичности; переместите творческий стиль на гардероб, свет или фон, а не на лицевые атрибуты.
Сначала проверьте новые LoRA лиц в песочнице Test LoRA, затем примените выбранный LoRA и вес к основному конвейеру для последовательного усиления идентичности.
Для согласованного кадрирования по партии держите соотношение сторон ваших входных изображений близким к целям изменения размера рабочего процесса, чтобы минимизировать давление обрезки и сохранить пропорции.

Благодарности#

Этот рабочий процесс реализует и основывается на следующих работах и ресурсах. Мы выражаем искреннюю благодарность RetroGazzaSpurs за рабочий процесс “Z-Image IMG2IMG for Characters: Endgame V3 - Ultimate Photorealism” за их вклад и поддержку. За авторитетными деталями, пожалуйста, обратитесь к оригинальной документации и репозиториям, указанным ниже.

Ресурсы#

RetroGazzaSpurs/Z-Image IMG2IMG for Characters: Endgame V3 - Ultimate Photorealism
- Документация / Примечания к выпуску: Источник рабочего процесса

Примечание: Использование упомянутых моделей, наборов данных и кода подлежит соответствующим лицензиям и условиям, предоставленным их авторами и поддерживающими.

Want More ComfyUI Workflows?

Flux Consistent Characters | Input Image

Создавайте последовательных персонажей и обеспечивайте их единообразный вид, используя ваши изображения.

Создатель Постоянного Персонажа

Создавайте постоянные, высококачественные дизайны персонажей с разных углов с полным контролем над эмоциями, освещением и окружением.

Flux UltraRealistic LoRA V2

Создавайте поразительно реалистичные изображения с Flux UltraRealistic LoRA V2

Flux PuLID для Подмены Лиц

Поднимите свои проекты по подмене лиц на новый уровень с Flux PuLID.

Portrait Master | Текст в Портрет

Используйте Portrait Master для большего контроля над созданием портретов, не полагаясь на сложные подсказки.

Qwen-Image Lightning | Ускорение на 8 шагов

Сократите время генерации вдвое.

Генерация звукового эффекта Woosh | Text2Audio + VideoSync

Преобразует подсказки и видео в резкие синхронизированные аудиоэффекты.

Hunyuan Video | Image-Prompt to Video

Преобразуйте изображение и текстовый запрос в динамическое видео.

Подписывайтесь на нас

Поддержка

Ресурсы

Юридическая информация

RunComfy

RunComfy - ведущая ComfyUI платформа, предлагающая ComfyUI онлайн среду и услуги, а также рабочие процессы ComfyUI с потрясающей визуализацией. RunComfy также предоставляет AI Models, позволяя художникам использовать новейшие инструменты AI для создания невероятного искусства.

Z-Image I2I для персонажей | Ultimate Photorealism