Этот рабочий процесс собирает Z-Image-Turbo и вращающуюся подборку донастроенных моделей Z-Image в единую, готовую к производству графику ComfyUI. Он предназначен для сравнения стилей бок о бок, поддержания согласованного поведения подсказок и получения четких, согласованных результатов с минимальными шагами. Под капотом он сочетает в себе оптимизированную загрузку UNet, нормализацию CFG, совместимую с AuraFlow выборку и опциональную инъекцию LoRA, чтобы вы могли исследовать реализм, кинематографические портреты, темное фэнтези и образы, вдохновленные аниме, без необходимости перенастраивать ваш холст.
Z-Image Finetuned Models идеально подходит для художников, инженеров подсказок и исследователей моделей, которые хотят быстро оценить несколько контрольных точек и LoRA, оставаясь в одной согласованной линии. Введите одну подсказку, отрендерьте четыре вариации из разных донастроек Z-Image и быстро выберите стиль, который лучше всего соответствует вашему заданию.
Tongyi-MAI Z-Image-Turbo. Диффузионный трансформер с одним потоком на 6B параметров, дистиллированный для фотореалистичной генерации текста в изображение с сильной приверженностью инструкциям и двуязычным рендерингом текста. Официальные веса и примечания по использованию находятся на карточке модели, а технический отчет и методы дистилляции подробно описаны на arXiv и в репозитории проекта. Model • Paper • Decoupled-DMD • DMDR • GitHub • Diffusers pipeline
BEYOND REALITY Z-Image (коммунальная донастройка). Контрольная точка Z-Image с уклоном в фотореализм, которая подчеркивает глянцевые текстуры, четкие края и стилизованную отделку, подходящую для портретов и композиций, похожих на продукты. Model
Z-Image-Turbo-Realism LoRA (пример LoRA, используемый в этом рабочем процессе в линии LoRA). Легкий адаптер, который продвигает ультрареалистичное рендеринг, сохраняя базовое выравнивание подсказок Z-Image-Turbo; загружается без замены вашей базовой модели. Model
Семейство AuraFlow (референс, совместимый с выборкой). Рабочий процесс использует крючки выборки в стиле AuraFlow для стабильных генераций с небольшим количеством шагов; смотрите справочник по конвейеру для информации о планировщиках AuraFlow и их целях дизайна. Docs
График организован в четыре независимые линии генерации, которые разделяют общий текстовый энкодер и VAE. Используйте одну подсказку, чтобы управлять всеми линиями, затем сравните результаты, сохраненные из каждой ветви.
Общая модель
CLIPTextEncode (#75) и добавьте дополнительные ограничения в отрицательный CLIPTextEncode (#74). Это сохраняет одинаковое условие через ветви, чтобы вы могли справедливо оценить, как каждая донастройка ведет себя. VAELoader (#21) предоставляет декодер, используемый всеми линиями для преобразования латентов обратно в изображения.Z-Image (Base Turbo)
UNETLoader (#100) и патчирует его с помощью ModelSamplingAuraFlow (#76) для стабильности с небольшим количеством шагов. CFGNorm (#67) стандартизирует поведение руководства без классификатора, чтобы контраст и детали оставались предсказуемыми в разных подсказках. EmptyLatentImage (#19) определяет размер холста, затем KSampler (#78) генерирует латенты, которые декодируются VAEDecode (#79) и записываются SaveImage (#102). Используйте эту ветку в качестве базовой при оценке других моделей Z-Image Finetuned.Z-Image-Turbo + Realism LoRA
LoraLoaderModelOnly (#106) поверх базовой UNETLoader (#82). ModelSamplingAuraFlow (#84) и CFGNorm (#64) сохраняют выходные данные четкими, в то время как LoRA продвигает реализм без перегрузки предмета. Определите разрешение с помощью EmptyLatentImage (#71), генерируйте с помощью KSampler (#85), декодируйте через VAEDecode (#86) и сохраняйте с помощью SaveImage (#103). Если LoRA кажется слишком сильным, уменьшите его вес здесь, а не чрезмерно редактируйте вашу подсказку.BEYOND REALITY донастройка
UNETLoader (#88), чтобы создать стилизованный, высококонтрастный вид. CFGNorm (#66) укрощает руководство, чтобы визуальный почерк оставался чистым, когда вы изменяете выборки или шаги. Установите ваш целевой размер в EmptyLatentImage (#72), отрендерьте с помощью KSampler (#89), декодируйте VAEDecode (#90), и сохраняйте через SaveImage (#104). Используйте ту же подсказку, что и базовая линия, чтобы увидеть, как эта донастройка интерпретирует композицию и освещение.Red Tide Dark Beast AIO донастройка
CheckpointLoaderSimple (#92), затем нормализуется CFGNorm (#65). Эта линия акцентирует внимание на мрачных цветовых палитрах и более тяжелом микроконтрасте, сохраняя хорошее соблюдение подсказок. Выберите вашу рамку в EmptyLatentImage (#73), генерируйте с помощью KSampler (#93), декодируйте с помощью VAEDecode (#94), и экспортируйте из SaveImage (#105). Это практичный способ тестировать более грубую эстетику в той же настройке Z-Image Finetuned Models.ModelSamplingAuraFlow (#76, #84)
shift тонко регулирует траектории выборки; рассматривайте его как диск тонкой настройки, который взаимодействует с вашим выбором выборщика и бюджетом шагов. Для лучшей сравнимости между линиями сохраняйте тот же выборщик и регулируйте только одну переменную (например, shift или вес LoRA) за тест. Справочник: фоновая информация и заметки по планированию AuraFlow. DocsCFGNorm (#64, #65, #66, #67)
strength, если блики теряются или текстуры кажутся несогласованными между линиями; уменьшите, если изображения начинают выглядеть чрезмерно сжатыми. Сохраняйте его похожим между ветками, когда хотите чистое A/B сравнение моделей Z-Image Finetuned.LoraLoaderModelOnly (#106)
strength контролирует стилистическое воздействие; более низкие значения сохраняют базовый реализм, в то время как более высокие значения навязывают вид LoRA. Если LoRA подавляет лица или типографику, сначала уменьшите его вес, затем уточните формулировку подсказок.KSampler (#78, #85, #89, #93)
shift небольшими шагами, чтобы изолировать причину и следствие.SaveImage имеют уникальные метки, чтобы вы могли быстро сравнивать и курировать.Ссылки для дальнейшего чтения:
Этот рабочий процесс реализует и основывается на следующих работах и ресурсах. Мы с благодарностью признаем модели HuggingFace за их вклад и поддержку. Для получения авторитетных деталей, пожалуйста, обратитесь к оригинальной документации и репозиториям, приведенным ниже.
Примечание: использование упомянутых моделей, наборов данных и кода подлежит соответствующим лицензиям и условиям, предоставленным их авторами и поддерживающими.
RunComfy - ведущая ComfyUI платформа, предлагающая ComfyUI онлайн среду и услуги, а также рабочие процессы ComfyUI с потрясающей визуализацией. RunComfy также предоставляет AI Models, позволяя художникам использовать новейшие инструменты AI для создания невероятного искусства.