Wan 2.2 VACE в ComfyUI | Рабочий процесс видео с движением, управляемым позой

ComfyUI Workflow

Wan 2.2 VACE in ComfyUI | Pose-Driven Motion Video Workflow

Want to run this workflow?

Fully operational workflows
No missing nodes or models
No manual setups required
Features stunning visuals

ComfyUI Examples

Генерация видео, управляемого позой, с помощью Wan 2.2 VACE для ComfyUI#

Этот рабочий процесс ComfyUI Wan 2.2 VACE превращает одно референсное изображение в видео, соответствующее движению, которое следует за позой, ритмом и движением камеры исходного клипа. Он использует Wan 2.2 VACE для сохранения идентичности при переводе сложного движения тела в плавную, реалистичную анимацию.

Разработанный для генерации танцев, переноса движения и креативной анимации персонажей, рабочий процесс автоматизирует стиль подсказок из референсного изображения, извлекает сигналы движения из исходного видео и запускает двухэтапный Wan 2.2 sampler, который балансирует согласованность движения и тонкие детали.

Ключевые модели в рабочем процессе ComfyUI Wan 2.2 VACE#

Модели Wan 2.2 14B Text-to-Video (варианты с высоким и низким уровнем шума). Два этапа используют основу с высоким уровнем шума для надежного формирования движения, за которой следует основа с низким уровнем шума для уточнения деталей.
Wan 2.1 VAE (bf16). Декодирует и кодирует латентные видеофреймы для Wan 2.2 VACE.
Google UMT5-XXL Encoder. Предоставляет текстовые характеристики высокой емкости, используемые Wan 2.2 для кондиционирования. Model card
Microsoft Florence-2 (Flux Large). Создает богатую подпись из референсного изображения для начальной загрузки и стилизации подсказки. Repo
Depth Anything v2 (ViT-L). Создает карты глубины для каждого кадра из видео источника движения для руководства структурой и движением. Repo

Как использовать рабочий процесс ComfyUI Wan 2.2 VACE#

Рабочий процесс состоит из пяти сгруппированных этапов: Inputs, PROMPT, Models, SAMPLING и Output. Вы предоставляете одно референсное изображение и одно короткое видео с движением. Граф затем вычисляет руководство движением, кодирует характеристики идентичности VACE, запускает двухпроходной Wan 2.2 sampler и сохраняет как финальную анимацию, так и необязательный предварительный просмотр бок о бок.

Inputs#

Загрузите исходный клип движения в VHS_LoadVideo (#141). Вы можете обрезать с помощью простых элементов управления и ограничить кадры для памяти. Кадры изменяются для согласованности, затем DepthAnythingV2Preprocessor (#135) вычисляет плотную последовательность глубины, которая фиксирует позу, компоновку и движение камеры. Загрузите ваше изображение идентичности с помощью LoadImage (#113); оно автоматически изменяется по размеру и предварительно просматривается, чтобы вы могли проверить кадрирование перед выборкой.

PROMPT#

Florence2Run (#137) анализирует референсное изображение и возвращает подробную подпись. Style Prompt (#138) объединяет эту подпись с короткой фразой стиля, затем WanVideoTextEncode (#16) кодирует окончательные положительные и отрицательные подсказки с использованием UMT5-XXL. Вы можете свободно редактировать фразу стиля или полностью заменить положительную подсказку, если хотите более сильное творческое направление. Эта встраиваемая подсказка кондиционирует оба этапа sampler, чтобы сгенерированное видео оставалось верным вашему референсу.

Models#

WanVideoVAELoader (#38) загружает Wan VAE, используемый в процессе кодирования/декодирования. Два узла WanVideoModelLoader подготавливают модели Wan 2.2 14B: одну с высоким уровнем шума и одну с низким уровнем шума, каждая дополнена модулем VACE, выбранным в WanVideoExtraModelSelect (#99, #107). Необязательная доработка LoRA присоединяется через WanVideoLoraSelect (#56, #97), позволяя вам настроить резкость или стиль без изменения базовых моделей. Конфигурация разработана так, чтобы вы могли менять веса VACE, LoRA или вариант шума, не затрагивая остальную часть графа.

SAMPLING#

WanVideoVACEEncode (#100) объединяет три сигнала в встраивания VACE: последовательность движения (кадры глубины), ваше референсное изображение и геометрию целевого видео. Первый WanVideoSampler (#27) запускает модель с высоким уровнем шума до разделительного шага, чтобы установить движение, перспективу и глобальный стиль. Второй WanVideoSampler (#90) продолжает с того латентного состояния и завершает с моделью с низким уровнем шума, чтобы восстановить текстуры, края и мелкие детали, сохраняя движение привязанным к источнику. Короткий график CFG и разделение шагов контролируют, насколько каждый этап влияет на результат.

Output#

WanVideoDecode (#28) преобразует финальное латентное состояние обратно в кадры. Вы получаете два сохраненных видео: чистый рендер и бок о бок, который размещает сгенерированные кадры рядом с референсом для быстрой проверки качества. Отдельный «Предпросмотр карты глубины» показывает предполагаемую последовательность глубины, чтобы вы могли быстро диагностировать руководство движением. Настройки частоты кадров и имени файла доступны в выходах VHS_VideoCombine (#139, #60, #144).

Ключевые узлы в рабочем процессе ComfyUI Wan 2.2 VACE#

`WanVideoVACEEncode` (#100)#

Создает встраивания идентичности и геометрии VACE, используемые обоими sampler. Предоставьте ваши кадры движения и референсное изображение; узел обрабатывает ширину, высоту и количество кадров. Если вы измените длительность или аспект, держите этот узел в синхронизации, чтобы встраивания соответствовали макету целевого видео.

`WanVideoSampler` (#27)#

Первый этап sampler, использующий модель Wan 2.2 с высоким уровнем шума. Настройте steps, короткий график cfg и разделение end_step, чтобы решить, сколько траектории выделено на формирование движения. Более крупные изменения движения или камеры выигрывают от немного более позднего разделения.

`WanVideoSampler` (#90)#

Второй этап sampler, использующий модель Wan 2.2 с низким уровнем шума. Установите start_step на то же значение разделения, чтобы он продолжался бесшовно с первого этапа. Если вы видите чрезмерную резкость текстур или дрейф, уменьшите значения позднего cfg или снизьте силу LoRA.

`DepthAnythingV2Preprocessor` (#135)#

Извлекает стабильную последовательность глубины из исходного видео. Использование глубины в качестве руководства движением помогает Wan 2.2 VACE сохранять компоновку сцены, позу руки и окклюзию. Для быстрой итерации вы можете уменьшить входные кадры; для финальных рендеров подавайте кадры с более высоким разрешением для лучшей структурной точности.

`WanVideoTextEncode` (#16)#

Кодирует положительные и отрицательные подсказки с помощью UMT5-XXL. Подсказка автоматически создается из Florence2Run, но вы можете переопределить ее для художественного направления. Держите подсказки краткими; с руководством идентичности VACE, меньшее количество ключевых слов часто приводит к более чистой, менее ограниченной передаче движения.

Дополнительные опции#

Выбирайте клипы движения с четким разделением объектов и постоянным освещением для наиболее стабильных переносов Wan 2.2 VACE.
Используйте вывод бок о бок, чтобы проверить выравнивание лица и непрерывность наряда перед финальным рендером.
Если движение кажется слишком жестким, переместите разделение немного раньше, чтобы этап с низким уровнем шума имел больше пространства для доработки.
Если идентичность дрейфует, увеличьте влияние LoRA или упростите подсказку.
Предпросмотр глубины — ваш друг: если глубина шумная, попробуйте другой исходный клип или настройте изменение размера входа, чтобы уменьшить артефакты.

Благодарности#

Этот рабочий процесс реализует и основывается на следующих работах и ресурсах. Мы с благодарностью признаем создателей сообщества ComfyUI Wan 2.2 VACE Source за рабочий процесс, за их вклад и поддержку. Для получения авторитетных деталей, пожалуйста, обратитесь к оригинальной документации и репозиториям, указанным ниже.

Ресурсы#

Wan 2.2 VACE Source/Wan 2.2 VACE Source
- Документы / Примечания к выпуску: Wan 2.2 VACE @ComfyUI

Примечание: использование указанных моделей, наборов данных и кода подлежит соответствующим лицензиям и условиям, предоставленным их авторами и обслуживающими организациями.

Want More ComfyUI Workflows?

Wan 2.2 + Lightx2v V2 | Сверхбыстрое I2V & T2V

Двойная настройка Light LoRA, в 4 раза быстрее.

Wan 2.2 FLF2V | Генерация видео из первого и последнего кадров

Создавайте плавные видео из начального и конечного кадра с помощью Wan 2.2 FLF2V.

Wan 2.2 Lightning T2V I2V | 4-шаговая ультрабыстрая

Wan 2.2 теперь в 20 раз быстрее! T2V + I2V в 4 шага.

VACE 14B: Все-в-одном для создания и редактирования видео

Создавайте, редактируйте и трансформируйте видео с мощным VACE Wan2.1 14B.

Wan2.2 Анимация | Фото в реалистичное видео движения

Преобразуйте изображения в реалистичных, движущихся персонажей с естественными движениями тела и лица.

IC-Light | Перезаписка видео | AnimateDiff

Перезаписывайте ваши видео с картами освещения и подсказками

Обход изображений | Умный рабочий процесс обхода обнаружения изображений

Обходите ограничения и обрабатывайте изображения быстрее с полным творческим контролем.

ComfyUI Vid2Vid Dance Transfer

Переносит движения и стиль с исходного видео на целевое изображение или объект.

Подписывайтесь на нас

Поддержка

Ресурсы

Юридическая информация

RunComfy

RunComfy - ведущая ComfyUI платформа, предлагающая ComfyUI онлайн среду и услуги, а также рабочие процессы ComfyUI с потрясающей визуализацией. RunComfy также предоставляет AI Models, позволяя художникам использовать новейшие инструменты AI для создания невероятного искусства.

Wan 2.2 VACE | Генератор видео с управлением позой