Qwen Image Edit 2511 для ComfyUI: редактирование одного изображения и многократная ссылка на изображения на основе инструкций
Этот рабочий процесс приносит Qwen Image Edit 2511 в ComfyUI для точного редактирования на основе инструкций, которое сохраняет структуру и идентичность ваших исходных изображений. Он поддерживает как редактирование одного изображения, так и использование ссылок на несколько изображений, позволяя выполнять перенос стиля, замену материала или объекта, изменение атрибутов и чистое визуальное улучшение с естественными, согласованными результатами.
Построенный на основе кодировщика видение-язык и дисперсионного трансформера, график преобразует простые английские инструкции в согласованное редактирование изображений. Опциональный Lightning LoRA делает генерации Qwen Image Edit 2511 быстрыми без ущерба для согласованности, поэтому художники и продуктовые команды могут быстро итерации по творческому редактированию изображений, изменению стиля персонажей и профессиональному улучшению контента.
Хотите более простой опыт без узлов? Попробуйте версию Playground, чтобы исследовать Qwen Image Edit 2511 Playground без использования узлов ComfyUI — просто загрузите изображение и редактируйте с помощью текстовых инструкций.
Ключевые модели в рабочем процессе ComfyUI Qwen Image Edit 2511
- Qwen‑Image‑Edit‑2511. Основной дисперсионный трансформер для редактирования с улучшенной согласованностью по сравнению с 2509, предназначенный для следования инструкциям при сохранении идентичности и геометрии. Hugging Face: Qwen/Qwen-Image-Edit-2511
- Qwen2.5‑VL‑7B‑Instruct. Кодировщик видение-язык, используемый в качестве основы для понимания текста/изображения; он выравнивает ваши инструкции с визуальным контекстом для редактирования на основе инструкций. Hugging Face: Qwen/Qwen2.5-VL-7B-Instruct
- Qwen Image VAE. Соответствующий вариационный автокодировщик, который отображает пространство пикселей и латентное пространство модели для точной реконструкции. (Файлы предоставлены через пакет Comfy‑Org.) Hugging Face: Comfy-Org/Qwen-Image_ComfyUI
- Qwen‑Image‑Edit‑2511‑Lightning (опционально). 4‑шаговое ускорение LoRA, которое значительно ускоряет семплирование, сохраняя при этом редактирование в соответствии с заданием; включите, когда хотите быстрые предварительные просмотры или почти в реальном времени редактирование одного изображения. Hugging Face: lightx2v/Qwen-Image-Edit-2511-Lightning
Как использовать рабочий процесс ComfyUI Qwen Image Edit 2511
Этот график содержит две параллельные дорожки: "Несколько изображений" для передачи атрибутов/материала между изображениями и "Одно изображение" для прямого редактирования на основе инструкций. Обе дорожки используют одни и те же загрузчики моделей и логику семплирования, и обе заканчиваются узлами предварительного просмотра и сохранения. Выберите дорожку, соответствующую вашей задаче, напишите четкую инструкцию и добавьте в очередь.
Несколько изображений › Загрузка изображения
Используйте эту группу для загрузки двух эталонных изображений: первое - это ваше базовое изображение для редактирования, а второе предоставляет вид, материал или атрибуты для переноса. Изображения автоматически изменяются до сбалансированных рабочих размеров, чтобы сохранить макет и избежать артефактов во время диффузии. Если возможно, выбирайте эталоны с аналогичной композицией или точкой зрения для улучшения выравнивания. Этот путь поддерживает задачи, такие как "заменить материал стула на левом изображении на материал с правого изображения", сохраняя форму и структуру.
Несколько изображений › Подсказка
Составьте короткую, явную инструкцию, описывающую цель редактирования и как второе изображение должно влиять на первое. Например: "Замените материал стула с Рисунка 1 на кожу с Рисунка 2, оставьте раму неизменной, соответствуйте освещению." Инструкция подается в кодировщик Qwen2.5‑VL, который связывает текст с загруженными визуальными данными для надежного редактирования изображений. Избегайте противоречивых целей; указывайте, что должно остаться неизменным для безопасных результатов.
Несколько изображений › Загрузка моделей
Эта группа загружает модель диффузии Qwen Image Edit 2511, кодировщик Qwen2.5‑VL и VAE. Вы можете опционально включить Lightning LoRA для ускорения редактирования при сохранении надежного следования инструкциям. Оставьте выбор моделей, предложенный шаблоном, если у вас нет причин заменить варианты.
Несколько изображений › KSampler и выход
Семплер выполняет контролируемую диффузию для реализации запрошенного редактирования, используя положительную кондиционировку из инструкции и обнуленную негативную кондиционировку для уменьшения непреднамеренных изменений. Результат декодируется VAE и автоматически объединяется с эталонами для предварительного просмотра "плечом к плечу", что облегчает проверку того, что редактирование одного изображения следовало вашей инструкции. Сохраните составное изображение или просто отредактированное изображение по мере необходимости.
Одно изображение › Загрузка изображения
Перетащите одно исходное изображение для редактирования. Этап масштабирования подготавливает его к целевому рабочему размеру, чтобы композиция оставалась стабильной, а мелкие детали оставались четкими. Это самый чистый путь для редактирования на основе инструкций, когда вам не нужно изображение-донор стиля или материала.
Одно изображение › Подсказка
Напишите прямую инструкцию, которая называет объект и точное изменение. Хорошие шаблоны включают "сохранить X, изменить Y," "улучшить Z," или "изменить стиль на [стиль] с той же композицией." Инструкция интегрируется с визуальным контекстом кодировщиком, чтобы модель диффузии могла применить точное редактирование одного изображения, сохраняя идентичность и геометрию.
Одно изображение › Загрузка моделей
Загрузчики моделей инициализируют Qwen Image Edit 2511, Qwen2.5‑VL и VAE. Опционально включите Lightning LoRA для более быстрых предварительных просмотров и быстрой итерации. Если вы отключите LoRA, базовая модель будет отдавать приоритет максимальной точности и согласованности.
Одно изображение › KSampler и выход
Семплер выполняет ваше редактирование с кондиционированием, полученным от кодировщика, а затем декодирует в изображение. Используйте предварительный просмотр, чтобы оценить, удовлетворило ли редактирование инструкцию без отклонения от оригинального вида. Сохраните окончательное изображение, когда будете удовлетворены.
Ключевые узлы в рабочем процессе ComfyUI Qwen Image Edit 2511
TextEncodeQwenImageEditPlusAdvance_lrzjason (#13, #64)
- Роль: Упаковывает вашу инструкцию с одним или несколькими эталонными изображениями в кондиционирование, которое направляет Qwen Image Edit 2511. Для многозадачных задач явно указывайте первое и второе изображение в инструкции, чтобы контролировать, что переносится. Если вы видите избыточное редактирование, сделайте инструкцию более ограниченной (например, "не изменяйте позу или освещение") и держите описание привязанным к реальным объектам на изображении.
KSampler (#48, #72)
- Роль: Управляет процессом диффузии, который превращает кондиционирование в окончательное редактирование. С включенным Lightning LoRA используйте очень мало шагов с низким руководством для скорости; без него увеличьте количество шагов для максимальной точности. Если результаты отклоняются, снизьте руководство; если изменение слишком тонкое, добавьте немного больше руководства или шагов.
LoraLoaderModelOnly (#49, #68)
- Роль: Внедряет Lightning LoRA для 4‑шагового ускорения. Держите вес около его значения по умолчанию для достоверных результатов и выключайте его, когда хотите сравнить с качеством базовой модели или уточнить сложное редактирование.
FluxKontextImageScale (#5, #6, #62)
- Роль: Изменяет размер входных данных до стабильных рабочих размеров, чтобы кодировщик и семплер видели согласованный пространственный контекст. Оставьте его включенным в большинстве случаев; если вам нужно точно сохранить оригинальное разрешение, сначала настройте здесь, а затем уточните с помощью семплера.
Опциональные дополнения
- Пишите инструкции, которые называют объект и объем: "измените цвет куртки на темно-синий, сохраните текстуру ткани и освещение" дает более надежное редактирование изображений, чем нечеткие стилистические подсказки.
- Для многозадачного переноса выбирайте доноров с аналогичной точкой зрения и освещением к базовому изображению; это улучшает соответствие материала и стиля.
- При включении Lightning для быстрых предварительных просмотров подтвердите окончательный результат стандартным запуском, если вам нужна абсолютная высокая точность.
- Если редактирование затрагивает слишком большую часть кадра, добавьте ограничения, такие как "оставить фон неизменным" или "сохранить черты лица", чтобы ужесточить поведение редактирования одного изображения.
Ссылки
- Qwen‑Image‑Edit‑2511 модель: Hugging Face
- Qwen2.5‑VL‑7B‑Instruct: Hugging Face
- Qwen Image VAE и пакеты файлов для ComfyUI: Hugging Face
- Qwen‑Image‑Edit‑2511‑Lightning LoRA: Hugging Face
- Qwen‑Image технический отчет: arXiv
Благодарности
Этот рабочий процесс реализует и основывается на следующих работах и ресурсах. Мы выражаем благодарность Qwen за модель Qwen-Image-Edit-2511 за их вклад и поддержку. Для получения авторитетных деталей, пожалуйста, обратитесь к оригинальной документации и репозиториям, приведенным ниже.
Ресурсы
- Qwen/Qwen-Image-Edit-2511
- GitHub: QwenLM/Qwen-Image
- Hugging Face: Qwen/Qwen-Image-Edit-2511
- arXiv: 2508.02324
Примечание: Использование упомянутых моделей, наборов данных и кода подчиняется соответствующим лицензиям и условиям, предоставленным их авторами и поддерживающими.


