Krea 2 перенос стиля ComfyUI workflow: стиль одного изображения, совершенно новые сцены#
Этот Krea 2 перенос стиля ComfyUI workflow переносит визуальный язык одного эталонного изображения на совершенно новую композицию. Он сохраняет ваш субъект и кадрирование свежими, перенося текстуру, палитру и рендеринг из постеров, аниме-клеток, акварели, глины, масляной живописи или фотографических стилей. Он построен для RunComfy и сочетает Krea 2 Turbo с Qwen3-VL текстовым кодированием, Qwen Image VAE и путём кондиционирования Untwisting RoPE для надёжного захвата стиля одним кадром.
Создатели получают эффективный путь для тестирования множества стилей против одной и той же подсказки без копирования и вставки макетов сцены. Инверсия RF в сочетании с стеком Untwisting RoPE сосредотачивается на стиле, а не на структуре, так что ваши сгенерированные изображения остаются композиционно новыми, но выглядят так, как будто они принадлежат одной эстетической семье.
Ключевые модели в ComfyUI Krea 2 перенос стиля workflow#
- Krea 2 Turbo. Диффузионный каркас, используемый для синтеза целевого изображения. Он предлагает быстрое, высококачественное создание и предоставляет пространство признаков, которое модифицирует инъекция стиля. Model card
- Qwen3-VL 4B текстовый кодировщик. Кодирует ваши подсказки в векторы кондиционирования, подходящие для Krea 2, обеспечивая точное руководство по содержанию, оставляя при этом пространство для сильного переноса стиля. Распространяется с Krea 2 Comfy pack. Weights repo
- Qwen Image VAE. Обрабатывает преобразования изображения-в-латентное и латентное-в-изображение с точностью, что критично при извлечении эталонного стиля и при декодировании конечного результата. Weights repo
Как использовать ComfyUI Krea 2 перенос стиля ComfyUI workflow#
На высоком уровне вы загружаете один эталонный стиль, масштабируете его до целевого разрешения, кодируете в латенты, извлекаете сигналы стиля через инверсию RF, прикрепляете этот сигнал к Krea 2 с помощью Untwisting RoPE, затем выбираете из свежего латента, направляемого вашей подсказкой. Разделы ниже следуют основной траектории от входных данных до предварительного просмотра.
Загрузите эталонный стиль (LoadImage (#612))#
Загрузите одно изображение, стиль которого вы хотите перенести. Выберите кадр с акцентом на стиль с чёткими материалами, освещением и цветом, чтобы инверсия имела сильный сигнал для обучения. Вы можете повторно использовать тот же эталон, тестируя, как стиль адаптируется к различным темам.
Масштабируйте эталон до целевого разрешения (ImageScaleToTotalPixelsX (#265))#
Эталон изменяется с использованием узла Масштаб Изображения до Общего Количества Пикселей, чтобы статистика стиля соответствовала целевому холсту. Это помогает стабилизировать инверсию RF и избегает искажений при кодировании эталона VAE. Если ваша цель квадратная или кинематографическая, масштабируйте соответственно, чтобы соотношение сторон, которое вы планируете сгенерировать, было отражено здесь.
Кодируйте эталон в латенты (VAEEncode (#333))#
Масштабированный эталон кодируется Qwen Image VAE в латентное представление. Поддержание согласованности VAE между кодированием и декодированием сохраняет цветовую и текстурную согласованность. Высококачественная реконструкция здесь приносит дивиденды в качестве последующего переноса стиля.
Кодируйте ваши подсказки (CLIPTextEncode (#607) и CLIPTextEncode (#259))#
Ваша целевая подсказка кодируется текстовым кодировщиком Qwen3-VL. Ту же подсказку можно опционально подать в эталонную ветвь для этапа инверсии, что часто улучшает согласование между изученным стилем и сценой, которую вы хотите создать. Если вы предпочитаете, вы можете разделить подсказки, но использование одной и той же целевой подсказки для обеих является хорошим стандартом.
Извлечение сигнала стиля (RFInversion (#603))#
Инверсия RF читает латентное представление эталона и кондиционирование подсказки, чтобы выделить компактный код стиля и слегка адаптированную базовую модель. Это подчёркивает цветовые, материальные и похожие на мазки особенности, при этом снижая акцент на макете и идентичности объекта. Это шаг, который превращает один кадр в повторно используемый дескриптор стиля.
Присоедините стиль к модели (UntwistingRoPE (#623) с UnofficialExtensions (#632))#
Untwisting RoPE внедряет код стиля в Krea 2 Turbo, модулируя внимание через полосу блоков U-Net. Метод тщательно балансирует ротационное позиционное кодирование, чтобы перенос действовал как наложение вида, а не пересадка макета. Опциональный узел расширений открывает дополнительные элементы управления, используемые той же реализацией. Ссылка: ComfyUi-Untwisting-RoPE.
Инициализация нового холста (EmptyLatentImage (#634))#
Создаётся пустой латент с шириной и высотой, полученной из вашего масштабированного эталона. Начало с шума обеспечивает новые композиции, которые не копируют макет эталона. Это сохраняет дух переноса стиля, обеспечивая оригинальную сцену.
Образец изображения (KSampler (#635) с ConditioningZeroOut (#636))#
Образец используется моделью с присоединённым стилем и вашим положительным кондиционированием для создания нового изображения из шума. Отрицательное кондиционирование обнуляется по умолчанию, чтобы стиль мог доминировать без борьбы за низкоуровневые функции. Образцы стиля SDE или другие образцы с добавлением шума, такие как er_sde или euler_ancestral, хорошо работают для уменьшения артефактов переноса через траекторию.
Декодирование и предварительный просмотр (VAEDecode (#262) и PreviewImage (#617))#
Конечный латент декодируется Qwen Image VAE обратно в RGB и отображается для обзора. Поскольку один и тот же VAE используется в обоих направлениях, цвета и текстуры остаются верными задуманному виду. Сохраните и экспериментируйте, изменяя семя или подсказку, чтобы исследовать стиль на разных темах и кадрированиях.
Ключевые узлы в ComfyUI Krea 2 перенос стиля ComfyUI workflow#
RFInversion (#603)#
Роль: изучает компактное представление стиля эталонного изображения и возвращает слегка адаптированную модель плюс латент стиля. Увеличьте его влияние, если стиль кажется слишком слабым, или уменьшите, если стиль подавляет идентичность субъекта. Поддерживается реализацией Untwisting RoPE для ComfyUI, которая документирует пресеты и поведение инверсии. Ссылка: ComfyUi-Untwisting-RoPE.
UntwistingRoPE (#623)#
Роль: внедряет изученный стиль в Krea 2 через выбранные блоки U-Net, компенсируя ротационные позиционные эффекты, чтобы структура оставалась новой. Настройте диапазон блоков, чтобы расширить или сузить область применения стиля, отрегулируйте параметры масштаба для баланса между приверженностью и свободой и используйте контроль адаптивной нормализации экземпляра, чтобы поднять или укротить перенос палитры и материалов. Небольшие значения согласования подпространства могут стабилизировать мелкие детали, если края кажутся дрожащими. Ссылка: ComfyUi-Untwisting-RoPE.
ImageScaleToTotalPixelsX (#265)#
Роль: масштабирует эталон стиля до целевого бюджета пикселей и соотношения сторон перед кодированием. Выберите метод ресемплинга, такой как Lanczos, для чётких краёв, и укажите размеры, которые соответствуют вашему предполагаемому размеру генерации. Это выравнивание уменьшает алиасинг в VAE и улучшает стабильность кода стиля. Ссылка: ComfyUi-Scale-Image-to-Total-Pixels-Advanced.
KSampler (#635)#
Роль: выполняет диффузионную траекторию, используя модель с присоединённым стилем и ваше кондиционирование подсказки. Образцы, которые добавляют шум вдоль пути, как правило, вымывают остаточные намёки на макет и обеспечивают более чистый перенос стиля; попробуйте er_sde или euler_ancestral. Умеренные шаги и сбалансированная шкала руководства обычно удерживают как стиль, так и содержание на правильном пути, сохраняя разнообразие через семя.
Дополнительные возможности#
- Начните с эталона с акцентом на стиль, который показывает чистое освещение, сильные материалы и минимальный беспорядок.
- Используйте ту же целевую подсказку как для ветви инверсии, так и для основной ветви, чтобы стиль и содержание были синхронизированы.
- Предпочитайте SDE или образцы с добавлением шума, такие как
er_sdeилиeuler_ancestral, чтобы уменьшить артефакты переноса. - Сопоставьте соотношение сторон масштабированного эталона с вашим целевым выводом, затем исследуйте другие соотношения, когда стиль будет подходящим.
- Если результат копирует макет эталона, уменьшите влияние стиля или переместите стиль в более узкий диапазон блоков в
UntwistingRoPE.
Ресурсы, используемые в этом Krea 2 перенос стиля ComfyUI workflow:
- Krea 2 Turbo модельная карта: Hugging Face
- Krea 2 Comfy весовой пакет, включая Qwen3-VL текстовый кодировщик и Qwen Image VAE: Hugging Face
- Untwisting RoPE ComfyUI расширение: GitHub
- Масштабирование изображения до общего количества пикселей Advanced: GitHub
Благодарности#
Этот workflow реализует и основывается на следующих работах и ресурсах. Мы выражаем искреннюю благодарность krea за модель Krea-2-Turbo, Comfy-Org за веса Krea-2 ComfyUI, BigStationW за пользовательские узлы ComfyUI Untwisting RoPE и Scale Image to Total Pixels Advanced, и сообществу r/StableDiffusion за первый выпуск и исходный код workflow. Для получения авторитетной информации, пожалуйста, обратитесь к оригинальной документации и репозиториям, указанным ниже.
Ресурсы#
- Reddit/первый выпуск и источник workflow
- Документация / Примечания к выпуску: r/StableDiffusion пост
- krea/Krea-2-Turbo
- Hugging Face: krea/Krea-2-Turbo
- Comfy-Org/Krea-2
- Hugging Face: Comfy-Org/Krea-2
- BigStationW/ComfyUi-Untwisting-RoPE
- BigStationW/ComfyUi-Scale-Image-to-Total-Pixels-Advanced
Примечание: Использование упомянутых моделей, наборов данных и кода подчиняется соответствующим лицензиям и условиям, предоставленным их авторами и поддерживающими сторонами.









