Этот рабочий процесс обеспечивает быстрые и контролируемые редактирования изображений с помощью семейства Qwen. С одной подсказкой вы можете выполнить inpainting, заменить фоны, вставить или удалить объекты и применить кинематографическое перенастройку освещения, сохраняя локальные детали. Qwen Image Edit идеально подходит для художников и создателей, которые хотят точных преобразований без сложных графов узлов.
Граф организован в простые шаги: загрузите модели, загрузите изображение, напишите подсказки, затем выполните выборку и сохраните. В комплекте с опциональной Lightning LoRA для ультра-быстрых 4-шаговых редактирований, так что вы можете быстро итеративно и закрепить желаемый вид.
qwen_image_edit_fp8_e4m3fn.safetensors
в .qwen_2.5_vl_7b_fp8_scaled.safetensors
в .qwen_image_vae.safetensors
в .Qwen-Image-Lightning-4steps-V1.0.safetensors
на .Граф загружает UNet для редактирования с помощью UNETLoader
(#37), текстовый энкодер с помощью CLIPLoader
(#38), и латентный кодек с помощью VAELoader
(#39). Если вы хотите более быструю итерацию, включите опциональную LoraLoaderModelOnly
(#89) для применения Lightning LoRA поверх базовой модели. ModelSamplingAuraFlow
(#66) и CFGNorm
(#75) подготавливают сэмплер так, чтобы модель Qwen Image Edit следовала подсказкам без переизбыточности деталей.
Используйте LoadImage
(#78) для выбора фотографии, которую вы хотите изменить. Изображение проходит через ImageScaleToTotalPixels
(#93), чтобы сохранить разрешение в диапазоне, дружественном к качеству, что помогает Qwen Image Edit избегать артефактов от очень больших входных данных. VAEEncode
(#88) преобразует пиксели в латенты для эффективного редактирования, сохраняя структуру.
Напишите свою инструкцию в TextEncodeQwenImageEdit
(#76) как положительное указание. Примеры включают “заменить фон на городской пейзаж на закате,” “убрать человека на заднем плане,” или “мягкий золотой ключевой свет слева.” Используйте второй TextEncodeQwenImageEdit
(#77) в качестве негативного руководства, когда нужно избежать изменений, например “не изменяйте лицо субъекта” или “сохраните цвет куртки.” Оба энкодера видят загруженное вами изображение и VAE, так что кондиционирование остается согласованным с контентом.
KSampler
(#3) выполняет редактирование с использованием патченной модели и вашего кондиционирования. Если Lightning LoRA включена, вы можете сойтись на очень немногих шагах; в противном случае используйте больше шагов для максимальной точности. Отредактированный латент декодируется VAEDecode
(#8) и записывается на диск через SaveImage
(#60).
TextEncodeQwenImageEdit
(#76)Кодирует основную инструкцию, которая управляет редактированием. Предпочитайте прямые глаголы, такие как “заменить,” “вставить,” “убрать,” “перекрасить,” и “перенастроить освещение.” Если изменение должно быть локальным, укажите регион или объект явно. Держите подсказки краткими; длинные списки тегов стиля редко нужны.
TextEncodeQwenImageEdit
(#77)Предоставляет негативное или защитное руководство. Используйте его, чтобы сказать модели, что избегать или сохранять ключевые атрибуты. Хорошие паттерны: “сохранить тон кожи,” “не изменять композицию,” “игнорировать текст на фоне.”
LoraLoaderModelOnly
(#89)Применяет Qwen-Image-Lightning LoRA для быстрой итерации. Включите его, когда вам нужны почти мгновенные результаты. Сократите количество шагов сэмплера существенно, когда эта LoRA активна, чтобы поддерживать четкость редактирований.
ImageScaleToTotalPixels
(#93)Уменьшает размер слишком больших входных данных до целевого бюджета мегапикселей для стабилизации качества. Используйте его, когда исходные изображения очень большие или содержат сильную компрессию; это часто улучшает гладкость краев и уменьшает гало.
CFGNorm
(#75)Нормализует поведение свободного от классификаторов руководства так, чтобы модель следовала подсказкам без создания артефактов. Если вы видите перенасыщение или “переизбыточность,” немного уменьшите силу; если редактирования кажутся робкими, немного увеличьте её.
KSampler
(#3)Запускает цикл диффузии. Начните с умеренных шагов для fp8 и увеличивайте только если редактирование не завершено. Поддерживайте умеренное руководство; очень высокие значения могут размывать сохраненные регионы. Когда Lightning LoRA включена, используйте очень мало шагов, чтобы воспользоваться её скоростным преимуществом.
Этот рабочий процесс реализует и развивает следующие работы и ресурсы. Мы искренне благодарим QwenLM за Qwen-Image-Edit, QwenLM за Qwen-Image, и ComfyOrg за ComfyUI Native Workflow Example за их вклад и поддержку. Для авторитетных деталей, пожалуйста, обратитесь к оригинальной документации и репозиториям, указанным ниже.
Примечание: Использование указанных моделей, наборов данных и кода подлежит соответствующим лицензиям и условиям, предоставленным их авторами и поддерживающими лицами.
RunComfy - ведущая ComfyUI платформа, предлагающая ComfyUI онлайн среду и услуги, а также рабочие процессы ComfyUI с потрясающей визуализацией. RunComfy также предоставляет AI Playground, позволяя художникам использовать новейшие инструменты AI для создания невероятного искусства.