LongCat Image Edit Turbo: Быстрое редактирование изображений на основе подсказок в ComfyUI#
LongCat Image Edit Turbo — это специально разработанный рабочий процесс в ComfyUI для быстрого редактирования на основе подсказок, который сохраняет ваш объект и композицию. Он сочетает в себе модель LongCat Image Edit Turbo с кондиционированием Qwen2.5-VL и AE VAE для рестайлинга персонажей, локализованных изменений, похожих на маски, и кинематографических корректировок освещения в быстром, удобном для итераций цикле.
Разработан для создателей и опытных пользователей, этот граф LongCat Image Edit Turbo принимает любое исходное изображение, интерпретирует ваше намерение редактирования через кодировщик vision-language и возвращает высококачественные результаты, которые сохраняют исходное кадрирование. Он готов к RunComfy и оптимизирован для быстрых предварительных просмотров и контролируемого уточнения.
Основные модели в рабочем процессе Comfyui LongCat Image Edit Turbo#
- LongCat Image Edit Turbo (bf16). Модель диффузии, обеспечивающая быстрые правки изображений с сохранением композиции, активно реагируя на текстовые подсказки. Файл модели
- Qwen2.5-VL 7B текстовый кодировщик (FP8 scaled, ComfyUI packaged). Обеспечивает богатое кондиционирование, понимая как вашу подсказку, так и визуальный контекст из входного изображения. Файл кодировщика
- AE VAE (ae.safetensors). Восстанавливает изображения из латентных переменных с низкими потерями, помогая LongCat Image Edit Turbo сохранять мелкие детали после сэмплирования. Файл VAE
Как использовать рабочий процесс Comfyui LongCat Image Edit Turbo#
Рабочий процесс следует четкому пути от вашего изображения и подсказки к декодированному результату. Этапы организованы вокруг нескольких решающих компонентов, которые поддерживают быстрые и стабильные правки.
Загрузите и подготовьте исходное изображение#
- Импортируйте вашу картинку с помощью
LoadImage(#79). Граф направляет её черезFluxKontextImageScale(#64) для стандартизации масштаба для надежного редактирования. - Затем изображение устанавливает рабочий холст через
GetImageSize(#72) иEmptyLatentImage(#61), что помогает LongCat Image Edit Turbo сохранять композицию и расположение объекта. - Эта подготовка гарантирует, что последующие правки будут действовать как умные, похожие на маски корректировки, а не полностью новое синтезирование.
Закодируйте ваше намерение редактирования с помощью Qwen#
- Рабочий процесс загружает кодировщик Qwen2.5-VL с помощью
CLIPLoader(#19). - Опишите изменение, которое вы хотите, в
TextEncodeQwenImageEditPlus (Positive)(#53). Используйте четкие указания стиля, освещения или атрибутов для применения LongCat Image Edit Turbo. - Используйте
TextEncodeQwenImageEditPlus (Negative)(#54), чтобы перечислить элементы, которых следует избегать или защищать, что помогает сохранить идентичность и избежать нежелательных изменений. - Кодировщик читает как ваш текст, так и исходное изображение, создавая кондиционирование, которое привязывает изменения к исходной сцене.
Формируйте руководство и смешивание ссылок#
FluxGuidance(#21) иFluxGuidance(#22) регулируют, насколько сильно положительные и отрицательные инструкции влияют на результат. Более сильный акцент на положительных инструкциях приводит к более смелым правкам; более низкий - к более тонким, безопасным для композиции корректировкам.FluxKontextMultiReferenceLatentMethod(#51) иFluxKontextMultiReferenceLatentMethod(#52) контролируют, как смешиваются несколько ссылок, если вы решите их добавить. По умолчанию вспомогательный подграф с надписью “DO NOT USE (LEAVE BYPASSED)” остаётся неактивным; замените его на свои загрузчики изображений, если хотите добавить дополнительные стили или атрибуты.
Запустите сэмплер#
- LongCat Image Edit Turbo UNet загружается
UNETLoader(#18) и нормализуется для стабильного управления с помощьюCFGNorm(#23). KSampler(#27) выполняет фактические шаги диффузии, превращая ваше намерение и контекст в новую латентную переменную. Начните с быстрых итераций для предварительных просмотров, затем уточняйте подсказку или силу управления по мере необходимости для окончательного качества.- Сосредоточьте правки на одной, чёткой цели за проход для наиболее предсказуемых результатов.
Декодируйте и экспортируйте#
- AE VAE загружается через
VAELoader(#20) и используетсяVAEDecode(#25) для восстановления изображения из образца с высокой точностью. SaveImage(#9) записывает результат в ваш выходной каталог с чётким префиксом, что облегчает отслеживание вариаций между запусками.
Основные узлы в рабочем процессе Comfyui LongCat Image Edit Turbo#
TextEncodeQwenImageEditPlus (Positive)(#53). Превращает желаемое изменение в кондиционирование, учитывающее редактирование, с помощью Qwen2.5-VL и исходного изображения. Сосредоточьтесь на предмете и изменении, которое вы хотите, например, наряд, настроение, освещение или материал, чтобы направить LongCat Image Edit Turbo без изменения сцены.TextEncodeQwenImageEditPlus (Negative)(#54). Защищает идентичность и композицию, указывая, чего избегать. Используйте его для уменьшения артефактов или предотвращения нежелательных изменений стиля, сохраняя при этом сцены согласованными.FluxGuidance(#21). Настраивает, насколько активно положительные инструкции управляют правкой. Увеличьте для более сильного изменения стиля или драматического освещения; уменьшите, чтобы сохранить больше оригинального вида. Балансируйте это с детализацией вашей подсказки и количеством предоставленных ссылок.FluxKontextMultiReferenceLatentMethod(#51). Определяет, как несколько ссылок смешиваются в кондиционирование. Выберите метод, который соответствует вашей цели, например, более сильное слияние для переноса стиля против более лёгкого влияния для корректировки атрибутов.CFGNorm(#23). Нормализует поведение руководства, чтобы изменения оставались согласованными в различных настройках. Это помогает LongCat Image Edit Turbo оставаться стабильным, когда вы меняете подсказки или переключаете сэмплеры.KSampler(#27). Сердце генерации. Используйте его для быстрой итерации, зафиксируйте семя для воспроизводимости и экспериментируйте с различными сэмплерами, как только вам понравится направление. Настройте в тандеме сFluxGuidance, чтобы торговать силой редактирования против точности к оригиналу.FluxKontextImageScale(#64). Подготавливает и масштабирует входное изображение для последующих узлов. Этот шаг важен для поддержания стабильности кадрирования и пропорций через редактирование.
Дополнительные возможности#
- Добавьте больше ссылок. Если вам нужно руководство по нескольким изображениям, замените обходной вспомогательный подграф своими собственными узлами
LoadImageи подключите их к дополнительным входам ссылок в узлах кодирования Qwen. Это полезно для переноса стиля или гардероба, сохраняя позу и раскладку. - Советы по быстрой итерации. Начните с кратких подсказок, выполните быстрый предварительный просмотр, затем уточните формулировку или силу управления. Используйте семена для воспроизведения любимого вида и разветвления небольших вариаций.
- Локализованные изменения по формулировке. Четко укажите цель, например, "изменить только куртку на красную" или "мягкий контурный свет на объекте", чтобы управлять правками, похожими на маски, без необходимости в явной маске.
- GGUF вариант. Для сценариев с использованием CPU или очень низким VRAM вы можете переключиться на квантованные веса LongCat Image Edit Turbo с
UnetLoaderGGUF(#77). См. GGUF pack для доступных квантовок. Варианты модели
Благодарности#
Этот рабочий процесс реализует и основывается на следующих работах и ресурсах. Мы благодарны Comfy-Org за LongCat Image Edit Turbo и связанные компоненты, vantagewithai за модели LongCat Image Edit Turbo GGUF и сообществу Civitai за рабочий процесс LongCat Image Edit Turbo за их вклад и поддержку. Для получения авторитетных деталей, пожалуйста, обратитесь к оригинальной документации и репозиториям, указанным ниже.
Ресурсы#
- Civitai/Civitai источник рабочего процесса
- Документы / Примечания к выпуску: Страница модели Civitai
- Comfy-Org/LongCat Image Edit Turbo bf16 модель
- Hugging Face: Comfy-Org/LongCat-Image
- vantagewithai/LongCat Image Edit Turbo GGUF модели
- Hugging Face: vantagewithai/LongCat-Image-Edit-Turbo-GGUF
- Comfy-Org/Qwen 2.5 VL текстовый кодировщик
- Hugging Face: Comfy-Org/Qwen-Image_ComfyUI
- Comfy-Org/AE VAE
- Hugging Face: Comfy-Org/z_image_turbo
Примечание: Использование указанных моделей, наборов данных и кода подчиняется соответствующим лицензиям и условиям, предоставленным их авторами и разработчиками.










