Z-Image I2I Ultimate Photorealism: безопасное для идентичности уточнение лица на портретах
Z-Image I2I Ultimate Photorealism — это двухэтапный рабочий процесс ComfyUI для верного улучшения портретов image-to-image. Он сохраняет идентичность и общий внешний вид субъекта, добавляя реалистичные детали лица, корректируя выражение и избегая странных артефактов, характерных для замены лиц. Построенный вокруг Z-Image Turbo со специализированным руководством LoRA для лица, он идеально подходит для фотореалистичного редактирования портретов, ретуши и улучшений с сохранением идентичности из одного исходного изображения.
Конвейер сначала воспроизводит ваше входное фото с высокой точностью, затем избирательно улучшает лицо с помощью автоматического маскирования лица и осведомленного о выражении заполнения. Результат — это натуральный, реалистичный портрет, который сохраняет основное сходство. Этот README объясняет, как запустить и адаптировать рабочий процесс ComfyUI Z-Image I2I Ultimate Photorealism.
Примечание: для работы этого рабочего процесса требуется LoRA для лица. Загрузите свой собственный LoRA персонажа в узел группы
InputsCharacter Lora here.
Ключевые модели в рабочем процессе ComfyUI Z-Image I2I Ultimate Photorealism
- Модель диффузии Z-Image Turbo. Основной генератор image-to-image, который воспроизводит исходную композицию и освещение, позволяя при этом тонкие, фотореалистичные улучшения.
- ZImageTurbo VAE. Парный кодировщик/декодер для верного латентного преобразования, который минимизирует цветовые и контрастные отклонения в I2I.
- Адаптеры Face LoRA. Дополнительные LoRA для конкретных субъектов, которые усиливают черты идентичности без введения стилизации.
- Семейство Qwen3-VL Instruct. Используется для автоматического описания выражения лица и взгляда, чтобы улучшения соответствовали тому, что действительно на фото. См. карточки моделей для Qwen3-VL-2B-Instruct и Qwen3-VL-4B-Instruct. Интеграция узла ComfyUI предоставлена ComfyUI-QwenVL.
- Модель сегментации Anything Model 3 (SAM3). Сегментация с открытым словарем, которая изолирует область лица от базового прохода для точного, неразрушающего заполнения. См. facebookresearch/sam3 и обертку ComfyUI ComfyUI-SAM3.
Как использовать рабочий процесс ComfyUI Z-Image I2I Ultimate Photorealism
Рабочий процесс выполняется в двух скоординированных этапах: базовый I2I-рендер, который верно воспроизводит ваше изображение, за которым следует проход улучшения только лица, управляемый автоматическим маскированием и осведомленным о выражении запросом. Отдельная песочница позволяет тестировать LoRA лиц без изменения исходного изображения.
Входные данные
Загрузите свой портрет в LoadImage (#958). Изображение нормализуется с помощью ImageResizeKJv2 (#973) до стабильного рабочего размера, сохраняя композицию. Узел vision-language затем генерирует структурированный, фотодостоверный положительный запрос из изображения; длинная авто-запрос поступает из AILab_QwenVL (#962), который предназначен для описания того, что на фото, а не для изобретения нового контента. Вы можете оставить это как есть для редактирования с сохранением идентичности или заменить его своим собственным запросом для творческих вариаций. Текстовый кодировщик на основе GGUF предоставляет встраивания запросов, так что вы получаете согласованное кондиционирование даже в средах с низким VRAM.
Рендер
Базовый проход воссоздает входное фото как чистую, деноизированную отправную точку. CLIPTextEncode (#6) кодирует авто-запрос, CLIPTextEncode (#7) добавляет отрицательный запрос безопасности, а SeedVarianceEnhancer (#978) вводит небольшое, контролируемое количество вариации на ранних этапах, чтобы избежать низкого разнообразия семян, характерного для турбо-моделей. Исходное изображение кодируется с помощью VAEEncode (#960), и основной семплер ClownsharKSampler_Beta (#979) создает высококачественный латент, который декодируется в предварительно улучшенное изображение через VAEDecode (#860). Этот промежуточный результат сохраняется как “Output 1 Pre-Face Detail” для быстрого сравнения A/B.
Улучшение лица
Этап улучшения обнаруживает и улучшает только лицо, оставляя волосы, одежду и фон нетронутыми. LoadSAM3Model (#940) с SAM3Grounding (#939) находит точную маску лица из предварительно улучшенного изображения, используя текстовый запрос “лицо.” Маска смягчается с помощью GrowMaskWithBlur (#1008), а область лица обрезается в контексте с помощью InpaintCropImproved (#942) для более быстрого, высококачественного семплирования перед сшиванием назад. Второй AILab_QwenVL (#975) создает компактное описание, сосредоточенное только на выражении и взгляде, которое CLIPTextEncode (#944) превращает в положительное кондиционирование, в то время как ConditioningZeroOut (#945) намеренно обнуляет отрицательный канал, чтобы предотвратить излишнее подавление микродеталей лица. InpaintModelConditioning (#943) подготавливает замаскированные латенты; DifferentialDiffusion (#949) подталкивает модель к структурной согласованности; ClownsharKSampler_Beta (#985) заполняет улучшенное лицо; VAEDecode (#947) и InpaintStitchImproved (#950) объединяют улучшенное лицо обратно, не изменяя незамаскированные области. Финальное изображение сохраняется с помощью SaveImage (#989).
Тестирование LoRA
Используйте песочницу “Test Lora” для оценки LoRA лица без изменения вашего источника. CLIPTextEncode (#999, #1000) предоставляет простую тестовую пару запросов, EmptyLatentImage (#1001) создает чистый холст, а ClownsharKSampler_Beta (#1007) рендерит быстрые образцы, которые вы можете просмотреть. Это полезно для настройки выбора и веса LoRA перед запуском полного прохода улучшения идентичности.
Ключевые узлы в рабочем процессе ComfyUI Z-Image I2I Ultimate Photorealism
SAM3Grounding(#939). Обнаруживает лицо из текстового запроса на естественном языке с помощью SAM3, создавая чистые маски, устойчивые к перекрытиям и позам. Если маска слишком плотная или включает артефакты линии волос, осторожно расширьте или размыть её выше по потоку с помощьюGrowMaskWithBlur, чтобы избежать швов. Справка: facebookresearch/sam3 и ComfyUI-SAM3.InpaintCropImproved(#942) иInpaintStitchImproved(#950). Рабочий процесс обрезки и сшивания, который семплирует только замаскированную область с оптимальным разрешением, затем смешивает результат обратно в оригинал. Используйте его для установки целевого разрешения лица и контекста, при этом гарантируя, что незамаскированные пиксели никогда не перекодируются. Справка: ComfyUI-Inpaint-CropAndStitch.ClownsharKSampler_Beta(#979, #985). Продвинутый семплер RES4LYF с высокоточной явной выборкой и надежными опциями SDE, которые отлично подходят для фотореалистичного I2I и заполнения. Для работы, критичной к идентичности, выберите стабильный семплер RES и консервативное снижение шума; увеличьте шум, только если вы собираетесь значительно изменить выражение или детали кожи. Справка: RES4LYF.SeedVarianceEnhancer(#978). Добавляет контролируемый шум к положительным встраиваниям на ранних этапах, чтобы противодействовать низкому разнообразию семян в Z-Image Turbo, обеспечивая естественное разнообразие без отклонения идентичности. Увеличьте его силу, когда результаты выглядят слишком похожими на разных семенах; уменьшите, если ослабляется соответствие запросу. Справка: ChangeTheConstants/SeedVarianceEnhancer.DifferentialDiffusion(#949). Модифицирует модель для дифференциального снижения шума, что помогает сохранить основную структуру во время замаскированных редактирований. Держите его включенным для тонких, безопасных для идентичности уточнений лица; рассмотрите возможность отключения, если вы намеренно хотите более сильные стилистические изменения. Справка: поведение узла задокументировано в экосистемах ComfyUI и используется здесь как средство сохранения структуры.AILab_QwenVL(#962, #975). Запросы vision-language, которые читают фактическое содержимое изображения, чтобы сохранить руководство, привязанное к реальности, особенно для микро-выражений и направления взгляда. Предпочитайте краткие, буквальные формулировки в проходе лица, чтобы избежать введения новых атрибутов. Справка: ComfyUI-QwenVL и карточки моделей Qwen3-VL (2B, 4B).
Дополнительные возможности
- Используйте изображение “Output 1 Pre-Face Detail”, чтобы проверить базовую точность перед улучшением лица; это помогает отделить проблемы базового снижения шума от настроек маски или заполнения.
- Если улучшенное лицо кажется слишком сглаженным, слегка расширьте маску лица и уменьшите её размытие, чтобы увеличить учёт краёв, затем выполните только проход лица.
- Держите запросы фактическими для редактирования с сохранением идентичности; переместите творческий стиль на гардероб, свет или фон, а не на лицевые атрибуты.
- Сначала проверьте новые LoRA лиц в песочнице Test LoRA, затем примените выбранный LoRA и вес к основному конвейеру для последовательного усиления идентичности.
- Для согласованного кадрирования по партии держите соотношение сторон ваших входных изображений близким к целям изменения размера рабочего процесса, чтобы минимизировать давление обрезки и сохранить пропорции.
Благодарности
Этот рабочий процесс реализует и основывается на следующих работах и ресурсах. Мы выражаем искреннюю благодарность RetroGazzaSpurs за рабочий процесс “Z-Image IMG2IMG for Characters: Endgame V3 - Ultimate Photorealism” за их вклад и поддержку. За авторитетными деталями, пожалуйста, обратитесь к оригинальной документации и репозиториям, указанным ниже.
Ресурсы
- RetroGazzaSpurs/Z-Image IMG2IMG for Characters: Endgame V3 - Ultimate Photorealism
- Документация / Примечания к выпуску: Источник рабочего процесса
Примечание: Использование упомянутых моделей, наборов данных и кода подлежит соответствующим лицензиям и условиям, предоставленным их авторами и поддерживающими.





