logo
RunComfy
ComfyUIPlaygroundPricing
discord logo
ComfyUI>Рабочие процессы>Wan 2.2 Animate V2 | Генератор реалистичных видео с позами

Wan 2.2 Animate V2 | Генератор реалистичных видео с позами

Workflow Name: RunComfy/Wan-2-2-Animate-V2
Workflow ID: 0000...1300
Этот обновленный рабочий процесс позволяет превращать референсные изображения и видео с позами в реалистичные анимации полного тела. Благодаря улучшенному реализму и плавности движения, он точно захватывает выражения и динамику тела. Улучшенная временная согласованность обеспечивает кинематографические результаты каждый раз. Идеально подходит для аниматоров, рассказчиков и создателей контента, стремящихся к естественному движению. Вы можете создать сцены танца, рендеры выступлений или реалистичные клипы персонажей эффективно. Испытайте более плавный контроль движений и более высокую точность выводов, чем когда-либо прежде.

Рабочий процесс генерации видео на основе поз Wan 2.2 Animate V2 для ComfyUI

Wan 2.2 Animate V2 — это рабочий процесс генерации видео на основе поз, который превращает одно референсное изображение и управляющее видео с позами в реалистичную анимацию с сохранением идентичности. Он основывается на первой версии с более высоким качеством, более плавным движением и лучшей временной согласованностью, при этом тщательно следуя движениям всего тела и выражениям из исходного видео.

Этот рабочий процесс ComfyUI предназначен для создателей, которые хотят получить быстрые и надежные результаты для анимации персонажей, клипов танца и повествований на основе выступлений. Он сочетает в себе надежную предварительную обработку (позы, лица и маскирование объектов) с модельным семейством Wan 2.2 и необязательными LoRAs, чтобы вы могли с уверенностью настраивать стиль, освещение и обработку фона.

Основные модели в рабочем процессе ComfyUI Wan 2.2 Animate V2

  • Wan 2.2 Animate 14B. Основная модель диффузии видео, которая синтезирует временно согласованные кадры из мультимодальных встраиваний. Веса: Kijai/WanVideo_comfy_fp8_scaled (Wan22Animate).
  • Wan 2.1 VAE. Кодировщик/декодировщик латентного видео, используемый семейством Wan для восстановления RGB кадров с минимальными потерями. Веса: Wan2_1_VAE_bf16.safetensors.
  • UMT5‑XXL текстовый кодировщик. Кодирует подсказки, которые направляют внешний вид, сцену и кинематику. Веса: umt5‑xxl‑enc‑bf16.safetensors.
  • CLIP Vision (ViT‑H/14). Извлекает признаки, сохраняющие идентичность, из референсного изображения. Статья: CLIP.
  • ViTPose Whole‑Body (ONNX). Оценивает плотные ключевые точки тела, которые управляют переносом движения. Модели: ViTPose‑L WholeBody и ViTPose‑H WholeBody. Статья: ViTPose.
  • YOLOv10 детектор. Поставляет рамки для людей для стабилизации обнаружения поз и сегментации. Пример: yolov10m.onnx.
  • Segment Anything 2. Высококачественные маски объектов для сохранения фона, композитинга или предварительного освещения. Репозиторий: facebookresearch/segment-anything-2.
  • Необязательные LoRAs для стиля и переноса света. Полезны для повторного освещения и детализации текстур в выходах Wan 2.2 Animate V2. Примеры: Lightx2v и Wan22_relight.

Как использовать рабочий процесс ComfyUI Wan 2.2 Animate V2

На высоком уровне конвейер извлекает подсказки поз и лиц из управляющего видео, кодирует идентичность из одного референсного изображения, по желанию изолирует объект с помощью маски SAM 2, а затем синтезирует видео, которое соответствует движению, сохраняя идентичность. Рабочий процесс организован в четыре группы, которые сотрудничают для получения окончательного результата и двух удобных выходов для быстрой проверки качества (предварительные просмотры поз и масок).

Референсное изображение

Эта группа загружает ваш портрет или изображение полного тела, изменяет его размер до целевого разрешения и делает его доступным по всему графу. Измененное изображение сохраняется и повторно используется Get_reference_image и предварительно просматривается, чтобы вы могли быстро оценить кадрирование. Идентификационные признаки кодируются WanVideoClipVisionEncode (CLIP Vision) (#70), и то же изображение подается в WanVideoAnimateEmbeds (#62) как ref_images для более сильного сохранения идентичности. Предоставьте четкий, хорошо освещенный референс, который соответствует типу объекта в управляющем видео для достижения наилучших результатов. Свободное пространство и минимальные перекрытия помогают Wan 2.2 Animate V2 зафиксировать структуру лица и одежду.

Предварительная обработка

Управляющее видео загружается с помощью VHS_LoadVideo (#191), который открывает кадры, аудио, количество кадров и исходное fps для последующего использования. Подсказки поз и лиц извлекаются с помощью OnnxDetectionModelLoader (#178) и PoseAndFaceDetection (#172), затем визуализируются с помощью DrawViTPose (#173), чтобы вы могли подтвердить качество отслеживания. Изоляция объекта осуществляется Sam2Segmentation (#104), затем GrowMaskWithBlur (#182) и BlockifyMask (#108) для получения чистой, стабильной маски; вспомогательный DrawMaskOnImage (#99) предварительно просматривает матовую. Группа также стандартизирует ширину, высоту и количество кадров из управляющего видео, чтобы Wan 2.2 Animate V2 мог соответствовать пространственным и временным настройкам без догадок. Быстрые проверки экспортируются в виде коротких видео: наложение позы и предварительный просмотр маски для проверки без обучения.

Модели

WanVideoVAELoader (#38) загружает Wan VAE и WanVideoModelLoader (#22) загружает основу Wan 2.2 Animate. Необязательные LoRAs выбираются в WanVideoLoraSelectMulti (#171) и применяются через WanVideoSetLoRAs (#48); WanVideoBlockSwap (#51) может быть включен через WanVideoSetBlockSwap (#50) для архитектурных изменений, которые влияют на стиль и качество. Подсказки кодируются WanVideoTextEncodeCached (#65), а WanVideoClipVisionEncode (#70) превращает референсное изображение в надежные встраивания идентичности. WanVideoAnimateEmbeds (#62) объединяет признаки CLIP, референсное изображение, изображения поз, обрезки лица, необязательные фоновые кадры, маску SAM 2 и выбранное разрешение и количество кадров в одно встраивание анимации. Этот поток управляет WanVideoSampler (#27), который синтезирует латентное видео, согласованное с вашей подсказкой, идентичностью и подсказками движения, а WanVideoDecode (#28) преобразует латенты обратно в RGB кадры.

Коллаж результата

Чтобы помочь сравнить выходы, рабочий процесс собирает простой коллаж: сгенерированное видео рядом с вертикальной полосой, показывающей референсное изображение, обрезки лица, наложение позы и кадр из управляющего видео. ImageConcatMulti (#77, #66) создает визуальный коллаж, затем VHS_VideoCombine (#30) рендерит mp4 "Compare". Окончательный чистый выход рендерится VHS_VideoCombine (#189), который также переносит аудио из управляющего для быстрого просмотра. Эти экспорты облегчают оценку того, насколько хорошо Wan 2.2 Animate V2 следовал движению, сохранял идентичность и поддерживал предполагаемый фон.

Основные узлы в рабочем процессе ComfyUI Wan 2.2 Animate V2

VHS_LoadVideo (#191)
Загружает управляющее видео и открывает кадры, аудио и метаданные, используемые по всему графу. Держите объект полностью видимым с минимальной размытой движением для более сильного отслеживания ключевых точек. Если вы хотите более короткие тесты, ограничьте количество загружаемых кадров; держите исходное fps согласованным вниз по потоку, чтобы избежать рассинхронизации аудио в конечной комбинированной версии.

PoseAndFaceDetection (#172)
Запускает YOLO и ViTPose для создания ключевых точек всего тела и обрезок лица, которые непосредственно управляют переносом движения. Подайте ему изображения из загрузчика и стандартизированную ширину и высоту; необязательный вход retarget_image позволяет адаптировать позы к другой компоновке, когда это необходимо. Если наложение позы выглядит шумным, рассмотрите более качественную модель ViTPose и убедитесь, что объект не сильно перекрыт. Ссылка: ComfyUI‑WanAnimatePreprocess.

Sam2Segmentation (#104)
Генерирует маску объекта, которая может сохранить фон или локализовать повторное освещение в Wan 2.2 Animate V2. Вы можете использовать обнаруженные рамки из PoseAndFaceDetection или нарисовать быстрые положительные точки, если необходимо, чтобы уточнить матовую. Соедините это с GrowMaskWithBlur для более чистых краев на быстром движении и просмотрите результат с экспортом предварительного просмотра маски. Ссылка: Segment Anything 2.

WanVideoClipVisionEncode (#70)
Кодирует референсное изображение с помощью CLIP Vision, чтобы захватить подсказки идентичности, такие как структура лица, волосы и одежда. Вы можете усреднить несколько референсных изображений, чтобы стабилизировать идентичность, или использовать негативное изображение, чтобы подавить нежелательные черты. Центральные обрезки с согласованным освещением помогают создать более сильные встраивания.

WanVideoAnimateEmbeds (#62)
Объединяет признаки идентичности, изображения поз, обрезки лица, необязательные фоновые кадры и маску SAM 2 в одно встраивание анимации. Совместите ширину, высоту и количество_кадров с вашим управляющим видео для меньшего количества артефактов. Если вы видите дрейф фона, предоставьте чистые фоновые кадры и надежную маску; если дрейфует лицо, убедитесь, что обрезки лица присутствуют и хорошо освещены.

WanVideoSampler (#27)
Создает фактические латенты видео, направляемые вашей подсказкой, LoRAs и анимационным встраиванием. Для длинных клипов выберите между стратегией скользящего окна или контекстными опциями модели; соответствуйте оконный режим длине клипа, чтобы сбалансировать резкость движения и долгосрочную согласованность. Настройте планировщик и силу направляющих, чтобы сбалансировать качество, соответствие стилю и плавность движения, и рассмотрите возможность включения обмена блоками, если ваша стека LoRA выиграет от этого.

Необязательные дополнения

  • Начните с чистого управляющего клипа: стабильная камера, простое освещение и минимальное перекрытие дают Wan 2.2 Animate V2 наилучший шанс чисто отслеживать движение.
  • Используйте референс, который соответствует целевому наряду и компоновке; избегайте крайних углов или тяжелых фильтров, которые конфликтуют с вашей подсказкой или LoRAs.
  • Сохраните или замените фоны с помощью маски SAM 2; при композитинге держите края достаточно мягкими, чтобы избежать ореола на быстром движении.
  • Поддерживайте согласованность fps от загрузки до экспорта, чтобы сохранить синхронизацию губ и выравнивание ритма при переносе аудио.
  • Для быстрой итерации протестируйте короткий сегмент сначала, затем расширьте диапазон кадров, когда поза, идентичность и освещение будут выглядеть правильно.

Полезные ресурсы, использованные в этом рабочем процессе:

  • Узлы предварительной обработки: kijai/ComfyUI‑WanAnimatePreprocess
  • Модели ViTPose ONNX: ViTPose‑L, ViTPose‑H model и data
  • YOLOv10 детектор: yolov10m.onnx
  • Веса Wan 2.2 Animate 14B: Wan22Animate
  • LoRAs: Lightx2v, Wan22_relight

Благодарности

Этот рабочий процесс реализует и основывается на следующих работах и ресурсах. Мы с благодарностью признаем рабочий процесс Benji’s AI Playground и команду Wan за модель Wan 2.2 Animate V2 за их вклад и поддержку. Для авторитетных деталей, пожалуйста, обратитесь к оригинальной документации и репозиториям, приведенным ниже.

Ресурсы

  • Wan team/Wan 2.2 Animate V2
    • Документы / Примечания к выпуску: YouTube @Benji’s AI Playground

Примечание: Использование ссылочных моделей, наборов данных и кода подчиняется соответствующим лицензиям и условиям, предоставленным их авторами и поддерживающими.

Want More ComfyUI Workflows?

Wan 2.2 | Лидер в открытой генерации видео

Доступно сейчас! Лучшая точность + более плавное движение.

Wan 2.2 FLF2V | Генерация видео из первого и последнего кадров

Создавайте плавные видео из начального и конечного кадра с помощью Wan 2.2 FLF2V.

Wan 2.2 + Lightx2v V2 | Сверхбыстрое I2V & T2V

Двойная настройка Light LoRA, в 4 раза быстрее.

Wan 2.2 Lightning T2V I2V | 4-шаговая ультрабыстрая

Wan 2.2 теперь в 20 раз быстрее! T2V + I2V в 4 шага.

Wan2.2 Анимация | Фото в реалистичное видео движения

Преобразуйте изображения в реалистичных, движущихся персонажей с естественными движениями тела и лица.

Qwen Image Edit | Точное редактирование фотографий с использованием AI

Редактируйте фотографии быстро с точностью стиля, перенастройкой освещения и управлением объектами.

HunyuanCustom | Генератор видео с несколькими объектами

Создавайте видео с двумя объектами с выдающимся сохранением идентичности.

Генерация музыки ACE-Step | Создание аудио с помощью ИИ

Создавайте студийного качества музыку в 15 раз быстрее с прорывной технологией диффузии.

Подписывайтесь на нас
  • LinkedIn
  • Facebook
  • Instagram
  • Twitter
Поддержка
  • Discord
  • Email
  • Статус системы
  • партнёр
Ресурсы
  • Бесплатный ComfyUI онлайн
  • Руководства по ComfyUI
  • RunComfy API
  • ComfyUI Уроки
  • ComfyUI Узлы
  • Узнать больше
Юридическая информация
  • Условия обслуживания
  • Политика конфиденциальности
  • Политика в отношении файлов cookie
RunComfy
Авторское право 2025 RunComfy. Все права защищены.

RunComfy - ведущая ComfyUI платформа, предлагающая ComfyUI онлайн среду и услуги, а также рабочие процессы ComfyUI с потрясающей визуализацией. RunComfy также предоставляет AI Playground, позволяя художникам использовать новейшие инструменты AI для создания невероятного искусства.