IDM-VTON на ComfyUI: Реалистичная виртуальная примерка одежды

ComfyUI IDM-VTON Workflow

ComfyUI Workflow: IDM-VTON for Virtual Clothing Try-on

Want to run this workflow?

Fully operational workflows
No missing nodes or models
No manual setups required
Features stunning visuals

ComfyUI IDM-VTON Examples

idm-vton-on-comfyui-realistic-virtual-clothing-try-on-1135

IDM-VTON, сокращение от "Improving Diffusion Models for Authentic Virtual Try-on in the Wild," — это инновационная модель диффузии, которая позволяет вам реалистично примерять одежду виртуально, используя всего несколько входных данных. Что отличает IDM-VTON, так это его способность сохранять уникальные детали и идентичность одежды, генерируя результаты виртуальной примерки, которые выглядят невероятно аутентично.

1. Понимание IDM-VTON#

В основе IDM-VTON лежит модель диффузии, специально разработанная для виртуальной примерки. Чтобы использовать её, вам просто нужно представление человека и одежды, которую вы хотите примерить. IDM-VTON затем творит чудеса, создавая результат, который выглядит так, будто человек действительно носит одежду. Она достигает уровня точности и аутентичности одежды, который превосходит предыдущие методы виртуальной примерки на основе диффузии.

2. Внутренние механизмы IDM-VTON#

Так как же IDM-VTON удается создавать такую реалистичную виртуальную примерку? Секрет кроется в двух основных модулях, которые работают вместе для кодирования семантики входной одежды:

Первый — это адаптер подсказок изображений, сокращенно IP-Adapter. Этот умный компонент извлекает высокоуровневую семантику одежды — по сути, ключевые характеристики, которые определяют её внешний вид. Затем эта информация внедряется в слой перекрестного внимания основной модели диффузии UNet.
Второй модуль — это параллельный UNet под названием GarmentNet. Его задача — кодировать низкоуровневые особенности одежды — мельчайшие детали, которые делают её уникальной. Эти особенности затем внедряются в слой самовнимания основной модели UNet.

Но это еще не всё! IDM-VTON также использует детализированные текстовые подсказки как для одежды, так и для входных данных человека. Эти подсказки предоставляют дополнительный контекст, который усиливает аутентичность окончательного результата виртуальной примерки.

3. Применение IDM-VTON в ComfyUI#

3.1 Звезда шоу: Узел IDM-VTON#

В ComfyUI узел "IDM-VTON" — это мощный инструмент, который запускает модель диффузии IDM-VTON и генерирует результат виртуальной примерки.

Чтобы узел IDM-VTON творил чудеса, ему нужно несколько ключевых входных данных:

Pipeline: Это загруженный конвейер диффузии IDM-VTON, который управляет всем процессом виртуальной примерки.
Human Input: Изображение человека, который будет виртуально примерять одежду.
Pose Input: Предварительно обработанное представление DensePose входных данных человека, которое помогает IDM-VTON понять позу и форму тела человека.
Mask Input: Бинарная маска, указывающая, какие части входных данных человека являются одеждой. Эта маска должна быть преобразована в соответствующий формат.
Garment Input: Изображение одежды, которую нужно виртуально примерить.

3.2 Подготовка ко всему#

Чтобы запустить узел IDM-VTON, необходимо выполнить несколько подготовительных шагов:

Загрузка изображения человека: Узел LoadImage используется для загрузки изображения человека. <img src="https://cdn.runcomfy.net/workflow_assets/1135/readme01.webp" alt="IDM-VTON" width="500" />
Генерация изображения позы: Изображение человека проходит через узел DensePosePreprocessor, который вычисляет представление DensePose, необходимое IDM-VTON. <img src="https://cdn.runcomfy.net/workflow_assets/1135/readme02.webp" alt="IDM-VTON" width="500" />
Получение изображения маски: Существует два способа получить маску одежды: <img src="https://cdn.runcomfy.net/workflow_assets/1135/readme03.webp" alt="IDM-VTON" width="500" />

a. Ручное маскирование (рекомендуется)

Щелкните правой кнопкой мыши на загруженном изображении человека и выберите "Открыть в редакторе масок."
В интерфейсе редактора масок вручную замаскируйте области одежды.

b. Автоматическое маскирование

Используйте узел GroundingDinoSAMSegment для автоматического сегментирования одежды.
Задайте узлу текстовое описание одежды (например, "футболка").

Какой бы метод вы ни выбрали, полученная маска должна быть преобразована в изображение с помощью узла MaskToImage, который затем подключается ко входу "Mask Image" узла IDM-VTON.

Загрузка изображения одежды: Используется для загрузки изображения одежды.

Для более глубокого изучения модели IDM-VTON не пропустите оригинальную статью "Improving Diffusion Models for Authentic Virtual Try-on in the Wild". А если вас интересует использование IDM-VTON в ComfyUI, обязательно ознакомьтесь с выделенными узлами здесь. Огромная благодарность исследователям и разработчикам за эти невероятные ресурсы.

Want More ComfyUI Workflows?

Hunyuan3D | ComfyUI 3D Pack

Сначала создайте многоракурсные RGB изображения, затем преобразуйте их в 3D активы.

Hallo2 | Портретная анимация синхронизации губ

Аудио-управляемая синхронизация губ для портретной анимации в 4K.

Stable Diffusion 3.5

Stable Diffusion 3.5 (SD3.5) для высококачественного и разнообразного генерирования изображений.

ACE-Step 1.5XL Turbo comfyui workflow | Генератор текста в музыку

Преобразует ваш текст в потрясающую музыку быстро и четко.

LTX 2.3 Многовидовые Видео | Генератор Многокамерных Видео

Быстро превращает одиночное видео в последовательные сцены с несколькими камерами.

ACE++ Консистенция Персонажей

Создавайте согласованные изображения вашего персонажа в различных позах, ракурсах и стилях из одной фотографии.

Audioreactive Mask Dilation | Потрясающие Анимации

Преобразуйте своих субъектов и подарите им пульсирующие, движимые музыкой ауры, которые танцуют в ритме.

IPAdapter Plus (V2) + ControlNet | Изображение в Видео

Преобразуйте изображения в анимации с помощью ComfyUI IPAdapter Plus и ControlNet QRCode.

Подписывайтесь на нас

Поддержка

Ресурсы

Юридическая информация

RunComfy

RunComfy - ведущая ComfyUI платформа, предлагающая ComfyUI онлайн среду и услуги, а также рабочие процессы ComfyUI с потрясающей визуализацией. RunComfy также предоставляет AI Models, позволяя художникам использовать новейшие инструменты AI для создания невероятного искусства.

IDM-VTON | Виртуальная примерка