Wan2.2 VACE Fun — это творческий, управляемый подсказками рабочий процесс от референса к видео для ComfyUI. Предоставьте одно референсное изображение и текстовое описание, и график анимирует ваш объект в связное видео, сохраняя идентичность и стиль. Основанный на модуле Wan 2.2 VACE со ступенчатым семплером, он балансирует движение, точность и время выполнения, что делает его идеальным для концептуальных роликов, тестов персонажей и коротких клипов.
Этот рабочий процесс ComfyUI Wan2.2 VACE Fun сосредоточен на трёх вещах: сильной приверженности объекту из референсного изображения, выразительном движении, управляемом вашей подсказкой, и надежном экспорте в MP4 видео. Используйте его, когда вам нужны быстрые итерации, которые всё ещё кажутся кинематографичными, или когда вы хотите превратить статическое изображение в динамическую сцену без сложного создания ключевых кадров.
Рабочий процесс выполняется по этапам: вы устанавливаете глобальные настройки, подготавливаете референсное изображение, пишете подсказки, генерируете VACE-управляемое латентное видео, уточняете его через ступенчатое семплирование, затем декодируете и экспортируете. Группы организованы так, чтобы вы могли работать сверху вниз с минимальными затруднениями.
Эта группа централизует управление, которое считывает остальная часть графика: width
, height
, length
(кадры), fps
, steps
, sampling_shift
и seed
. Измените их один раз, и каждый последующий узел подхватит значения через пары SetNode
/GetNode
. Разрешение и длина влияют как на качество, так и на VRAM, в то время как fps
контролирует воспринимаемое движение в конечном MP4. Держите width
и height
соотносимыми с вашим референсным изображением, чтобы избежать растяжения. Seed открыт для воспроизводимости в разных запусках.
Загрузите ваш объект с помощью LoadImage
(#118), затем изображение изменяется в ImageResizeKJv2
(#112) для соответствия вашей целевой резолюции. RMBG
(#73) удаляет фон, чтобы VACE мог более надежно зафиксировать передний план объекта, помогая сохранению идентичности на всех кадрах. Узел предварительного просмотра позволяет быстро проверить вырез перед генерацией. Обработанное изображение хранится как референс и передаётся далее.
Подсказки кодируются с помощью CLIP Text Encode (Positive Prompt)
(#56) и CLIP Text Encode (Negative Prompt)
(#54) с использованием энкодера UMT5-XXL. Пишите чёткие глаголы действия, язык камеры и контекст сцены в положительной подсказке, чтобы направлять движение и композицию. Используйте отрицательную подсказку, чтобы подавить нежелательные артефакты, стили или беспорядок; многоязычные фразы работают хорошо. Выходные данные обеспечивают богатое условие для шага VACE и последующих семплеров.
График загружает веса Wan 2.2 T2V A14B и применяет модуль Wan2.2 VACE Fun, затем увеличивает внимание и планирование для стабильности. Ветвь HIGH проходит через PathchSageAttentionKJ
(#8) и ModelSamplingSD3
(#57), в то время как ветвь LOW использует LoraLoaderModelOnly
(#61), PathchSageAttentionKJ
(#66) и ModelSamplingSD3
(#20). Это разделение даёт вам ранний проход с акцентом на детали и уточнение, ориентированное на движение. Все выборы моделей заранее настроены; вы просто запускаете график, когда ваши настройки и подсказки готовы.
WanVaceToVideo
(#43) вводит ваш reference_image
, положительное/отрицательное условие и VAE, затем генерирует начальную последовательность латентных данных видео, размер которой определяется width
, height
и length
. Думайте об этом как о моменте, когда статическое изображение "учится" двигаться в соответствии с вашей подсказкой. Узел возвращает как потоки условия для повторного использования, так и целое число для обрезки латентных данных, чтобы сохранить согласованность кадров в трубопроводе. Ручная маска или контрольное видео не требуются, если вы не хотите экспериментировать.
Трёхступенчатая цепочка семплера формирует результат. Первый проход KSamplerAdvanced
(#108) задаёт последовательность латентных данных для общей композиции и движений. Второй проход KSamplerAdvanced
(#107) углубляет детали и временную стабильность, используя то же условие, сохраняя расположение сцены. Финальный проход KSamplerAdvanced
(#109) работает на варианте LOW, чтобы отполировать движение и уменьшить артефакты, находя практический баланс между скоростью и качеством. TrimVideoLatent
(#65) выравнивает кадры до целевой длины перед декодированием.
VAEDecode
(#19) превращает уточнённые латентные данные в RGB кадры. VHS_VideoCombine
(#69) затем собирает эти кадры в MP4 при выбранном вами fps
, сохраняя с разумной схемой именования файла. Эта группа оптимизирована для быстрых циклов рецензирования, чтобы вы могли итеративно улучшать подсказки, длину или разрешение без изменения остальной части графика. Когда вы довольны, оставьте тот же seed для повторяемости или измените его, чтобы исследовать варианты.
WanVaceToVideo
(#43)
Сердце Wan2.2 VACE Fun: связывает семантику подсказок с вашим референсным изображением и производит начальные латентные данные видео. Настройте width
, height
и length
здесь через общие настройки, чтобы достичь вашей творческой цели и бюджета VRAM. Держите референсный объект в центре и хорошо освещённым для лучшего сохранения идентичности. Если движение кажется неправильным, пересмотрите положительную подсказку, чтобы подчеркнуть действия, движения камеры и временные слова.
KSamplerAdvanced
(#108, #107, #109)
Ступенчатая цепочка семплера, которая постепенно улучшает композицию, детализацию и плавность движения. Увеличьте steps
, когда вам нужно больше деталей или временной стабильности, и используйте тот же seed
, чтобы справедливо сравнить изменения. Финальный проход по варианту LOW часто очищает тонкие артефакты; если результаты кажутся слишком мягкими, перенесите некоторые шаги на ранние проходы. sampling_shift
выставлен, чтобы сдвинуть график либо в сторону акцента на движении, либо на более тонкую текстуру.
RMBG
(#73)
Автоматическое удаление фона улучшает приверженность объекту для Wan2.2 VACE Fun, особенно в загруженных или низкоконтрастных сценах. Используйте качественные, нечёткие референсы, чтобы минимизировать ошибки вырезки. Если вы хотите естественные фоны, замените их позже в постобработке или скомпонуйте пластину за декодированными кадрами.
TrimVideoLatent
(#65)
Сохраняет последовательность латентных данных выровненной до запрашиваемой length
. Если вы расширяете или сокращаете клип, пусть этот узел управляет учётом; он предотвращает тонкий дрейф кадров через ступени семплера.
VHS_VideoCombine
(#69)
Кодирует конечные кадры в MP4. Настройте frame_rate
, чтобы управлять длительностью клипа относительно length
(длительность равна количеству кадров, делённому на fps). Повышайте качество для окончательной доставки или уменьшайте для быстрых предварительных просмотров; более высокое качество увеличивает размер файла и время кодирования.
width
и height
, чтобы избежать растяжения и нежелательных обрезок.length
и fps
в синхронизации с вашей целью: более высокий fps выглядит более плавно, но сокращает общую длительность для того же количества кадров.RMBG
и добавьте краткое условие идентичности в подсказке (одежда, цвет или снаряжение).Этот рабочий процесс реализует и основывается на следующих работах и ресурсах. Мы с благодарностью признаём @BenjisAIPlayground за рабочий процесс “Wan2.2 VACE Fun Demo” и за их вклад и поддержку. Для авторитетных деталей, пожалуйста, обратитесь к оригинальной документации и репозиториям, указанным ниже.
Примечание: Использование указанных моделей, наборов данных и кода подчиняется соответствующим лицензиям и условиям, предоставленным их авторами и поддерживающими лицами.
RunComfy - ведущая ComfyUI платформа, предлагающая ComfyUI онлайн среду и услуги, а также рабочие процессы ComfyUI с потрясающей визуализацией. RunComfy также предоставляет AI Playground, позволяя художникам использовать новейшие инструменты AI для создания невероятного искусства.