ByteDance USO в ComfyUI | Единый стиль и рабочий процесс темы

ComfyUI ByteDance USO Workflow

ByteDance USO in ComfyUI | Unified Style and Subject Workflow

Want to run this workflow?

Fully operational workflows
No missing nodes or models
No manual setups required
Features stunning visuals

ComfyUI ByteDance USO Examples

bytedance-uso-in-comfyui-unified-style-and-subject-workflow-1286-example_01.webp

bytedance-uso-in-comfyui-unified-style-and-subject-workflow-1286-example_02.webp

bytedance-uso-in-comfyui-unified-style-and-subject-workflow-1286-example_03.webp

bytedance-uso-in-comfyui-unified-style-and-subject-workflow-1286-example_04.webp

ByteDance USO: Рабочий процесс генерации единого стиля и темы для ComfyUI#

Этот рабочий процесс приносит ByteDance USO в ComfyUI для создателей, которые хотят получить персонажей, сохраняющих идентичность, и точный перенос стиля в одном месте. Построенный на FLUX.1‑dev, он поддерживает генерацию, основанную на теме, стиле и их комбинации, чтобы вы могли размещать персонажа в новых сценах, сохраняя сходство, применять стили из референсных изображений или делать и то, и другое одновременно.

Используйте ByteDance USO, когда вам нужна сильная согласованность темы с гибким, высококачественным контролем стиля. Граф включает две дополнительные ветви: путь темы+стиля, который основывается на изображении идентичности, и путь, управляемый подсказкой, который может использоваться с референсами стиля или без них. Обе ветви сохраняют изображения независимо, чтобы вы могли быстро сравнивать результаты.

Основные модели в рабочем процессе ComfyUI ByteDance USO#

FLUX.1‑dev. Базовый диффузионный трансформатор, который обеспечивает качество и скорость генерации. Он предоставляет основную систему выборки, используемую ByteDance USO в этом рабочем процессе. Модельная карта
ByteDance USO DiT LoRA v1. Адаптер низкого ранга, который внедряет возможности единого стиля и темы в FLUX.1‑dev, обеспечивая сохранение идентичности и руководство стилем в единой настройке. Файлы предоставлены в репаке USO 1.0. Репозиторий
USO FLUX.1 Projector v1. Проекторный патч, который соединяет функции CLIP‑Vision с основной системой генерации, чтобы стилистические и тематические подсказки могли эффективно управлять моделью. Включено в репак USO. Репозиторий
SigCLIP Vision (patch14, 384). Энкодер видения, который извлекает векторы из ваших референсных изображений стиля и темы, используемых модулями USO для визуального руководства. Репозиторий

Как использовать рабочий процесс ComfyUI ByteDance USO#

Граф имеет две ветви, которые могут работать независимо. Верхняя ветвь использует изображение идентичности плюс референсы стиля; нижняя ветвь управляется подсказкой и может опционально включать референсы стиля. Генерируйте из любой ветви или обеих.

Шаг 1 – Загрузка моделей#

Этот шаг инициализирует FLUX.1‑dev, ByteDance USO LoRA, проектор USO и энкодер видения SigCLIP. Он подготавливает базовую модель для единого руководства стилем и темой. Обе ветви загружают один и тот же набор, чтобы вы могли запускать рабочие процессы темы+стиля или подсказки без перенастройки моделей. После загрузки поток модели готов для процессоров референсов USO.

Шаг 2 – Изображение темы/идентичности#

Предоставьте чистое изображение идентичности вашего персонажа. Рабочий процесс масштабирует его до подходящего рабочего размера и кодирует в латентное представление, которое сохраняет ключевые черты лица или персонажа. Это латентное представление объединяется с вашей подсказкой, чтобы ByteDance USO мог разместить тему в новых сценах, сохраняя идентичность. Пропустите этот шаг, если вы хотите только генерацию стиля или текста.

Шаг 3 – Референс стиля#

Добавьте одно или два изображения стиля для руководства палитрой, материалами и техникой кисти. Каждое изображение кодируется с помощью модели видения и применяется через узлы референсов стиля USO, которые накладывают стилистические влияния на загруженную модель. Порядок важен при использовании двух референсов, так как второй референс применяется после первого. Вы можете обойти эту группу, чтобы выполнить чисто тематический или текстовый проход.

Подсказка#

Напишите подсказку, основанную на намерении, для композиции, настроения и деталей. В ветви темы+стиля ваша подсказка объединяется с латентным представлением идентичности и руководством USO, чтобы текст, тема и стиль двигались в одном направлении. В ветви, управляемой подсказкой, только текст (опционально с референсами стиля) управляет изображением. Держите подсказки конкретными; избегайте противоречий с выбранным стилем.

Размер изображения#

Выберите целевое разрешение для генерации. Выбранный размер влияет на плотность композиции и деталей, особенно для портретов и полноразмерных снимков. Если VRAM ограничен, начните с меньшего размера и увеличьте позже. Обе ветви имеют простой узел размера изображения, чтобы вы могли адаптировать аспект и четкость к вашему случаю использования.

Выборка и вывод#

Каждая ветвь выполняет выборку с помощью стандартного выборщика, декодирует в RGB и сохраняет в свой собственный вывод. Обычно вы получите два изображения за запуск: один результат стилизованной темы и один результат, управляемый подсказкой. Итерируйте, изменяя подсказку или меняя референсы; повторите выборку, чтобы исследовать альтернативы или зафиксируйте семя для повторяемости.

Основные узлы в рабочем процессе ComfyUI ByteDance USO#

`USOStyleReference` (#56)#

Применяет изображение стиля к текущему потоку модели, используя проектор USO и функции CLIP‑Vision. Используйте один референс для сильного, согласованного вида или цепочку из двух для тонких смесей; второй референс уточняет первый. Если стиль доминирует слишком сильно, попробуйте использовать один, более чистый референс или упростите его содержание.

`ReferenceLatent` (#44)#

Внедряет закодированное латентное представление темы в путь кондиционирования, чтобы ByteDance USO сохранял идентичность. Работает лучше всего с не загроможденными фотографиями идентичности, которые четко показывают лицо или определяющие черты персонажа. Если идентичность ускользает, предоставьте более полное референсное изображение или уменьшите конфликтующие стилистические подсказки.

`FluxKontextMultiReferenceLatentMethod` (#41)#

Комбинирует несколько референсных сигналов в контекстном пути FLUX. Здесь балансируются контексты темы и подсказки перед выборкой. Если результаты кажутся слишком ограниченными, ослабьте референсы; если они уходят в сторону, усилите изображения темы или упростите подсказку.

`FluxGuidance` (#35)#

Контролирует силу текстового руководства относительно референсных сигналов. Более низкие значения позволяют теме/стилю вести; более высокие значения усиливают подсказку. Настройте, когда видите, что подсказка недоиспользуется (повысьте руководство) или стиль/тема замещаются (понизьте руководство).

`ImageScaleToMaxDimension` (#109)#

Подготавливает изображение идентичности для стабильного извлечения признаков. Меньшие максимальные размеры способствуют более широкой композиции; большие размеры помогают, когда референс является плотным портретом и вам нужны более четкие идентификационные подсказки. Настройте в зависимости от того, является ли ваш референсный объект полноразмерным или портретом.

`EasyCache` (#95)#

Ускоряет вывод, повторно используя промежуточные состояния, когда изменения незначительны. Отлично подходит для корректировки подсказок и быстрого итерационного процесса, но может немного уменьшить микродетали. Отключите для окончательных, самых качественных рендеров.

`KSampler` (#31)#

Запускает диффузионные шаги и контролирует стохастичность через выбор семени и выборщика. Увеличьте шаги для большей детализации или зафиксируйте семя, чтобы воспроизвести вид, изменяя референсы. Если текстуры выглядят шумными, попробуйте другой выборщик или меньше шагов с более сильным руководством стилем.

Дополнительные возможности#

Для работы с идентичностью ByteDance USO предпочитайте нейтральные, равномерно освещенные изображения темы; избегайте сильного макияжа или экстремальных углов, которые могут конфликтовать со стилистическими подсказками.
При укладке двух референсов стиля сначала разместите более широкий эстетический стиль, а второй текстурный/детальный референс добавьте для уточнения без подавления идентичности.
Поддерживайте минимальное количество отрицательных подсказок; граф намеренно использует нейтральный отрицательный путь, чтобы наученные приоритеты и референсы USO хорошо согласовывались.
Быстро итерируйте на более низком разрешении или с включенным кэшированием, затем отключите кэширование и увеличьте ваши любимые семена для финалов.
Используйте воспроизводимые семена при сравнении режимов только с темой, только со стилем и комбинированного, чтобы понять, как ByteDance USO балансирует каждый сигнал.

Благодарности#

Этот рабочий процесс реализует и опирается на следующие работы и ресурсы. Мы с благодарностью признаем ByteDance за модель USO и команду ComfyUI за учебник по рабочему процессу ByteDance USO ComfyUI Native Workflow за их вклад и поддержку. Для получения авторитетных деталей, пожалуйста, обратитесь к оригинальной документации и репозиториям, указанным ниже.

Ресурсы#

ByteDance/USO
- GitHub: bytedance/USO
- Hugging Face: bytedance-research/USO
- arXiv: 2508.18966
- Документы / Примечания к выпуску: Документация ByteDance USO

Примечание: Использование упомянутых моделей, наборов данных и кода подчиняется соответствующим лицензиям и условиям, предоставленным их авторами и поддерживающими организациями.

Want More ComfyUI Workflows?

Flux Consistent Characters | Input Image

Создавайте последовательных персонажей и обеспечивайте их единообразный вид, используя ваши изображения.

DreamO | Унифицированная мультизадачная система настройки изображений

Выполните генерацию изображений идентичности, стиля, примерки и многозадачности из 1–3 эталонов

Flux Kontext 360 Degree LoRA

Создавайте погружающие 360-стиль изображения с глубиной и пространственным контролем.

Линейная Дилатация Маски | Потрясающие Анимации

Преобразуйте своих персонажей и заставьте их путешествовать по разным сценам без швов.

AnimateDiff + ControlNet | Стиль мраморной скульптуры

Преобразуйте ваши видео в вечные мраморные скульптуры, передающие сущность классического искусства.

Hunyuan Image to Video | Впечатляющий Создатель Движения

Создавайте великолепные фильмы из неподвижных изображений с кинематографическим движением и настраиваемыми эффектами.

Создайте Связные Сцены | Генератор Согласованного Искусства Истории

Создайте безупречные повествовательные сцены с богатой визуальной согласованностью.

Z Image Real Skin рабочий процесс | Генератор реалистичных портретов

Создает портреты с текстурой настоящей человеческой кожи и естественным освещением.

Подписывайтесь на нас

Поддержка

Ресурсы

Юридическая информация

RunComfy

RunComfy - ведущая ComfyUI платформа, предлагающая ComfyUI онлайн среду и услуги, а также рабочие процессы ComfyUI с потрясающей визуализацией. RunComfy также предоставляет AI Models, позволяя художникам использовать новейшие инструменты AI для создания невероятного искусства.

ByteDance USO | Генератор единого стиля и темы