Wan2.2 VACE Fun в ComfyUI | Рабочий процесс анимации изображений

Wan2.2 VACE Fun: Референсное изображение в анимированное видео в ComfyUI

Wan2.2 VACE Fun — это творческий, управляемый подсказками рабочий процесс от референса к видео для ComfyUI. Предоставьте одно референсное изображение и текстовое описание, и график анимирует ваш объект в связное видео, сохраняя идентичность и стиль. Основанный на модуле Wan 2.2 VACE со ступенчатым семплером, он балансирует движение, точность и время выполнения, что делает его идеальным для концептуальных роликов, тестов персонажей и коротких клипов.

Этот рабочий процесс ComfyUI Wan2.2 VACE Fun сосредоточен на трёх вещах: сильной приверженности объекту из референсного изображения, выразительном движении, управляемом вашей подсказкой, и надежном экспорте в MP4 видео. Используйте его, когда вам нужны быстрые итерации, которые всё ещё кажутся кинематографичными, или когда вы хотите превратить статическое изображение в динамическую сцену без сложного создания ключевых кадров.

Ключевые модели в рабочем процессе Comfyui Wan2.2 VACE Fun

Alibaba PAI Wan 2.2 VACE Fun A14B. Модуль VACE является ядром, которое превращает референсное изображение и подсказки в последовательность латентных данных, готовую к видео. Он разработан для анимаций, управляемых объектом, и сохранения идентичности. Карта модели
Wan 2.2 Text-to-Video A14B (HIGH/LOW). Рабочий процесс использует варианты HIGH и LOW в ступенчатом процессе уменьшения шума, чтобы обменивать скорость и детали там, где каждый из них наиболее эффективен. Упакованные веса, совместимые с ComfyUI, доступны здесь: Comfy-Org/Wan_2.2_ComfyUI_Repackaged
UMT5-XXL текстовый энкодер. Большой многоязычный текстовый энкодер, используемый Wan 2.x для понимания подсказок; поддерживает богатые английские и китайские подсказки. Смотрите перепакованные текстовые энкодеры в Comfy-Org/Wan_2.2_ComfyUI_Repackaged
Wan 2.1 VAE. Используется для декодирования конечных латентных данных видео в RGB кадры перед кодированием. Доступно в той же перепаковке: Comfy-Org/Wan_2.2_ComfyUI_Repackaged

Как использовать рабочий процесс Comfyui Wan2.2 VACE Fun

Рабочий процесс выполняется по этапам: вы устанавливаете глобальные настройки, подготавливаете референсное изображение, пишете подсказки, генерируете VACE-управляемое латентное видео, уточняете его через ступенчатое семплирование, затем декодируете и экспортируете. Группы организованы так, чтобы вы могли работать сверху вниз с минимальными затруднениями.

Настройка

Эта группа централизует управление, которое считывает остальная часть графика: width, height, length (кадры), fps, steps, sampling_shift и seed. Измените их один раз, и каждый последующий узел подхватит значения через пары SetNode/GetNode. Разрешение и длина влияют как на качество, так и на VRAM, в то время как fps контролирует воспринимаемое движение в конечном MP4. Держите width и height соотносимыми с вашим референсным изображением, чтобы избежать растяжения. Seed открыт для воспроизводимости в разных запусках.

Ref Img

Загрузите ваш объект с помощью LoadImage (#118), затем изображение изменяется в ImageResizeKJv2 (#112) для соответствия вашей целевой резолюции. RMBG (#73) удаляет фон, чтобы VACE мог более надежно зафиксировать передний план объекта, помогая сохранению идентичности на всех кадрах. Узел предварительного просмотра позволяет быстро проверить вырез перед генерацией. Обработанное изображение хранится как референс и передаётся далее.

Подсказка

Подсказки кодируются с помощью CLIP Text Encode (Positive Prompt) (#56) и CLIP Text Encode (Negative Prompt) (#54) с использованием энкодера UMT5-XXL. Пишите чёткие глаголы действия, язык камеры и контекст сцены в положительной подсказке, чтобы направлять движение и композицию. Используйте отрицательную подсказку, чтобы подавить нежелательные артефакты, стили или беспорядок; многоязычные фразы работают хорошо. Выходные данные обеспечивают богатое условие для шага VACE и последующих семплеров.

Модели

График загружает веса Wan 2.2 T2V A14B и применяет модуль Wan2.2 VACE Fun, затем увеличивает внимание и планирование для стабильности. Ветвь HIGH проходит через PathchSageAttentionKJ (#8) и ModelSamplingSD3 (#57), в то время как ветвь LOW использует LoraLoaderModelOnly (#61), PathchSageAttentionKJ (#66) и ModelSamplingSD3 (#20). Это разделение даёт вам ранний проход с акцентом на детали и уточнение, ориентированное на движение. Все выборы моделей заранее настроены; вы просто запускаете график, когда ваши настройки и подсказки готовы.

Условие VACE

WanVaceToVideo (#43) вводит ваш reference_image, положительное/отрицательное условие и VAE, затем генерирует начальную последовательность латентных данных видео, размер которой определяется width, height и length. Думайте об этом как о моменте, когда статическое изображение "учится" двигаться в соответствии с вашей подсказкой. Узел возвращает как потоки условия для повторного использования, так и целое число для обрезки латентных данных, чтобы сохранить согласованность кадров в трубопроводе. Ручная маска или контрольное видео не требуются, если вы не хотите экспериментировать.

Семплирование

Трёхступенчатая цепочка семплера формирует результат. Первый проход KSamplerAdvanced (#108) задаёт последовательность латентных данных для общей композиции и движений. Второй проход KSamplerAdvanced (#107) углубляет детали и временную стабильность, используя то же условие, сохраняя расположение сцены. Финальный проход KSamplerAdvanced (#109) работает на варианте LOW, чтобы отполировать движение и уменьшить артефакты, находя практический баланс между скоростью и качеством. TrimVideoLatent (#65) выравнивает кадры до целевой длины перед декодированием.

Выход

VAEDecode (#19) превращает уточнённые латентные данные в RGB кадры. VHS_VideoCombine (#69) затем собирает эти кадры в MP4 при выбранном вами fps, сохраняя с разумной схемой именования файла. Эта группа оптимизирована для быстрых циклов рецензирования, чтобы вы могли итеративно улучшать подсказки, длину или разрешение без изменения остальной части графика. Когда вы довольны, оставьте тот же seed для повторяемости или измените его, чтобы исследовать варианты.

Ключевые узлы в рабочем процессе Comfyui Wan2.2 VACE Fun

WanVaceToVideo (#43) Сердце Wan2.2 VACE Fun: связывает семантику подсказок с вашим референсным изображением и производит начальные латентные данные видео. Настройте width, height и length здесь через общие настройки, чтобы достичь вашей творческой цели и бюджета VRAM. Держите референсный объект в центре и хорошо освещённым для лучшего сохранения идентичности. Если движение кажется неправильным, пересмотрите положительную подсказку, чтобы подчеркнуть действия, движения камеры и временные слова.

KSamplerAdvanced (#108, #107, #109) Ступенчатая цепочка семплера, которая постепенно улучшает композицию, детализацию и плавность движения. Увеличьте steps, когда вам нужно больше деталей или временной стабильности, и используйте тот же seed, чтобы справедливо сравнить изменения. Финальный проход по варианту LOW часто очищает тонкие артефакты; если результаты кажутся слишком мягкими, перенесите некоторые шаги на ранние проходы. sampling_shift выставлен, чтобы сдвинуть график либо в сторону акцента на движении, либо на более тонкую текстуру.

RMBG (#73) Автоматическое удаление фона улучшает приверженность объекту для Wan2.2 VACE Fun, особенно в загруженных или низкоконтрастных сценах. Используйте качественные, нечёткие референсы, чтобы минимизировать ошибки вырезки. Если вы хотите естественные фоны, замените их позже в постобработке или скомпонуйте пластину за декодированными кадрами.

TrimVideoLatent (#65) Сохраняет последовательность латентных данных выровненной до запрашиваемой length. Если вы расширяете или сокращаете клип, пусть этот узел управляет учётом; он предотвращает тонкий дрейф кадров через ступени семплера.

VHS_VideoCombine (#69) Кодирует конечные кадры в MP4. Настройте frame_rate, чтобы управлять длительностью клипа относительно length (длительность равна количеству кадров, делённому на fps). Повышайте качество для окончательной доставки или уменьшайте для быстрых предварительных просмотров; более высокое качество увеличивает размер файла и время кодирования.

Дополнительные возможности

Начните с референсного изображения, аспект которого соответствует вашей целевой width и height, чтобы избежать растяжения и нежелательных обрезок.
Пишите подсказки, описывающие действия и движение камеры, а не только внешний вид; Wan2.2 VACE Fun хорошо реагирует на глаголы, такие как "идет", "панорамирует", "долли" и "быстрый наклон".
Держите length и fps в синхронизации с вашей целью: более высокий fps выглядит более плавно, но сокращает общую длительность для того же количества кадров.
Если идентичность колеблется, упростите фон через RMBG и добавьте краткое условие идентичности в подсказке (одежда, цвет или снаряжение).
Для более быстрых черновиков уменьшите разрешение или шаги, затем восстановите их для финалов; держите тот же seed, чтобы надёжно сравнивать версии.

Благодарности

Этот рабочий процесс реализует и основывается на следующих работах и ресурсах. Мы с благодарностью признаём @BenjisAIPlayground за рабочий процесс “Wan2.2 VACE Fun Demo” и за их вклад и поддержку. Для авторитетных деталей, пожалуйста, обратитесь к оригинальной документации и репозиториям, указанным ниже.

Ресурсы

PWan2.2 VACE Fun Demo
- Документы / Примечания к выпуску @BenjisAIPlayground: YouTube

Примечание: Использование указанных моделей, наборов данных и кода подчиняется соответствующим лицензиям и условиям, предоставленным их авторами и поддерживающими лицами.

Want More ComfyUI Workflows?

Wan 2.2 FLF2V | Генерация видео из первого и последнего кадров

Создавайте плавные видео из начального и конечного кадра с помощью Wan 2.2 FLF2V.

Wan 2.2 + Lightx2v V2 | Сверхбыстрое I2V & T2V

Двойная настройка Light LoRA, в 4 раза быстрее.

Wan FusionX | T2V+I2V+VACE Полное

Самое мощное решение для генерации видео! Детализация уровня кинотеатра, ваша личная киностудия.

Flux Consistent Characters | Input Image

Создавайте последовательных персонажей и обеспечивайте их единообразный вид, используя ваши изображения.

Эволюция Аудиореактивных Танцоров

Преобразуйте ваш объект с аудиореактивным фоном, состоящим из сложных геометрических фигур.

Pyramid Flow | Генерация видео

Включает режимы от текста к видео и от изображения к видео.

Hunyuan Video | Image-Prompt to Video

Преобразуйте изображение и текстовый запрос в динамическое видео.

FLUX.2 [klein] 4B и 9B | Ультрабыстрый генератор изображений Flux

Молниеносное создание визуалов с унифицированным контролем редактирования.

Подписывайтесь на нас

Поддержка

Ресурсы

Юридическая информация

RunComfy

RunComfy - ведущая ComfyUI платформа, предлагающая ComfyUI онлайн среду и услуги, а также рабочие процессы ComfyUI с потрясающей визуализацией. RunComfy также предоставляет AI Models, позволяя художникам использовать новейшие инструменты AI для создания невероятного искусства.

Wan2.2 VACE Fun | Изображение в анимированное видео

Wan2.2 VACE Fun: Референсное изображение в анимированное видео в ComfyUI

Ключевые модели в рабочем процессе Comfyui Wan2.2 VACE Fun

Как использовать рабочий процесс Comfyui Wan2.2 VACE Fun

Настройка

Ref Img

Подсказка

Модели

Условие VACE

Семплирование

Выход

Ключевые узлы в рабочем процессе Comfyui Wan2.2 VACE Fun

Дополнительные возможности

Благодарности

Ресурсы

Want More ComfyUI Workflows?

Wan 2.2 FLF2V | Генерация видео из первого и последнего кадров

Wan 2.2 + Lightx2v V2 | Сверхбыстрое I2V & T2V

Wan FusionX | T2V+I2V+VACE Полное

Flux Consistent Characters | Input Image

Эволюция Аудиореактивных Танцоров

Pyramid Flow | Генерация видео

Hunyuan Video | Image-Prompt to Video

FLUX.2 [klein] 4B и 9B | Ультрабыстрый генератор изображений Flux