WAN 2.2 Smooth Workflow v5.0: универсальная конвейерная линия ComfyUI для гладких 5‑секундных видео#
WAN 2.2 Smooth Workflow v5.0 — это единое полотно, которое охватывает текст‑к‑видео, изображение‑к‑видео, анимацию от первого к последнему кадру и аудио‑к‑видео. Оно построено вокруг семейства моделей SmoothMix WAN 2.2 с опциональными Lightx2v LoRAs, операторами WanVideoWrapper для WAN 2.x и интерполяцией кадров RIFE, чтобы вы могли создавать короткие кинематографические клипы с постоянным движением и быстрой итерацией.
Используйте этот WAN 2.2 Smooth Workflow v5.0, когда вам нужно организованное графическое представление, которое позволяет переключаться между T2V, I2V, F2LF и A2V без переподключения узлов. Полотно включает в себя переключатели режимов, управление длительностью и размером, предварительные просмотры последнего кадра и опциональную аудио-ветвь, которая может следовать визуальному ритму вашего клипа.
Ключевые модели в Comfyui WAN 2.2 Smooth Workflow v5.0#
- Контрольные точки SmoothMix WAN 2.2 Text‑to‑Video и Image‑to‑Video (Высокие и Низкие)
- Роль: основные диффузионные основы для синтеза и уточнения движения по путям T2V и I2V. Высокие предпочитают качество и детализацию; Низкие предпочитают скорость и запас по VRAM.
- Lightx2v WAN 2.2 Distill LoRAs
- Роль: опциональные LoRAs, дистиллированные для WAN 2.2, которые улучшают плавность движения или стилизацию, сохраняя реактивность подсказок. Загружайте по мере необходимости, чтобы управлять внешним видом и динамикой. lightx2v/Wan2.2-Distill-Loras
- WAN 2.x VAE
- Роль: VAE, используемый по всему полотну для кодирования и декодирования видео латентов, чтобы качество изображения и цветовой отклик оставались постоянными по всем ветвям.
- Текстовый энкодер WAN 2.x (семейство uMT5 XXL)
- Роль: специализированный текстовый энкодер, используемый WAN 2.x; рабочий процесс загружает соответствующий токенизатор/модель, чтобы подсказки правильно кондиционировали движение и внешний вид.
- Энкодер CLIP Vision (семейство ViT‑H)
- Роль: извлекает надежные встраивания начального и конечного кадров для пути анимации от первого к последнему кадру, улучшая временную согласованность во время интерполяции.
- Ветвь генерации аудио
- Роль: опциональный синтез аудио, учитывающий кадры, который кондиционируется по визуальному времени и текстовым подсказкам для создания элементов звуковой дорожки, согласованных с визуальным монтажом.
- Интерполяция видео RIFE
- Роль: увеличивает временную плавность и видимую частоту кадров, вставляя высококачественные промежуточные кадры, что идеально подходит для коротких кинематографических петель. Используется через интеграцию ComfyUI VFI. GACLove/ComfyUI-VFI
Как использовать Comfyui WAN 2.2 Smooth Workflow v5.0#
Полотно организовано в четыре производственных режима, которые вы можете включить с помощью переключателей на полотне. Во всех режимах вы увидите согласованные группы для Контрольных точек, CLIP/VAE, Подсказок, Размеров видео и Длительности, Выборки и Результата видео. Каждый режим может опционально включать генерацию аудио через переключатель Audio Enabler.
Текст к видео (T2V)#
Введите ваше описание в положительную подсказку и уточните с помощью отрицательной подсказки. Текст подсказки кодируется в CLIPTextEncode (#90) и комбинируется с WAN 2.x VAE. WanImageToVideo (#50) действует как точка входа T2V даже без начального изображения, создавая начальную латентную последовательность, которая передается в выборщики и затем декодируется. Интерполяция RIFE RIFEInterpolation (#160) сглаживает последовательность перед экспортом вашего MP4 с помощью VHS_VideoCombine (#77). Используйте Audio Enabler, чтобы создать звуковую дорожку из ваших кадров и аудио подсказки.
Изображение к видео (I2V)#
Перетащите одно изображение в группу IMAGE, затем установите размеры и длительность вашего видео. Изображение изменяется в размере и отправляется в WanImageToVideo (#172) вместе с вашими текстовыми подсказками, что создает латент, осознающий движение. Парные выборщики уточняют латент, затем результат декодируется, увеличивается и интерполируется для гладкого выхода. Включите группу I2V Audio, если вы хотите сгенерированный звук, соответствующий анимированному контенту.
Анимация от первого к последнему кадру (F2LF)#
Предоставьте начальный кадр и конечный кадр. График кодирует оба с помощью CLIP Vision и передает их в WanFirstLastFrameToVideo (#343), который планирует путь между первым и последним изображениями, уважая ваши текстовые подсказки. Высокие и Низкие выборщики SmoothMix затем формируют промежуточные кадры перед декодированием и интерполяцией. Результат экспортируется с помощью VHS_VideoCombine (#332), и опциональная аудио ветвь может синтезировать звуковую дорожку, согласованную с визуальным переходом.
Аудио к видео (A2V)#
Загрузите существующий клип в VHS_LoadVideo (#145). Рабочий процесс может опционально интерполировать его для дополнительной плавности, затем аудио ветвь создает звук на основе визуалов и вашей аудио подсказки. VHS_VideoCombine (#148) монтирует трек и экспортирует новый файл. Используйте предварительный просмотр последнего кадра на полотне, чтобы быстро проверить визуальную согласованность перед экспортом.
Экспорт и предварительные просмотры последнего кадра#
Каждый режим заканчивается группой Результата видео, которая записывает MP4 через узлы VHS_VideoCombine из VideoHelperSuite. Посвященная панель последнего кадра сохраняет и предварительно просматривает финальный кадр, чтобы вы могли оценить освещение, цвет и качество объекта с первого взгляда перед запуском полных генераций. Функциональность ввода/вывода видео и предварительных просмотров предоставляется VideoHelperSuite. pythongosssss/ComfyUI-VideoHelperSuite
Ключевые узлы в Comfyui WAN 2.2 Smooth Workflow v5.0#
WanImageToVideo (#50)
- Это точка входа видео WAN 2.x как для T2V, так и для I2V внутри WanVideoWrapper. Он объединяет ваши подсказки с VAE (и опциональным начальным изображением), чтобы построить начальный латент движения. Контроль размеров и длины выше по потоку должен уважать ограничения, дружественные к модели, и этот узел питает парные выборщики, которые следуют. Подробности реализации WanVideoWrapper и обновления поддерживаются здесь: kijai/ComfyUI-WanVideoWrapper.
WanFirstLastFrameToVideo (#343)
- Управляет путем от первого к последнему кадру, поглощая встраивания CLIP Vision для обоих граничных кадров вместе с вашими текстовыми подсказками. Он создает направленную траекторию, которая сохраняет идентичность объекта и макет сцены, одновременно трансформируясь к цели. Держите начальные и конечные кадры выровненными по масштабу и композиции объекта для наиболее естественных переходов.
KSamplerWithNAG (Advanced) (#234)
- Применяет Noise Assisted Guidance для улучшения соответствия подсказкам и уменьшения временного дрейфа в коротких клипах. Регулируйте его руководство только тогда, когда вы видите чрезмерное ограничение или недостаточное ограничение; он работает в тандеме со стандартным выборщиком и вашей отрицательной подсказкой. См. метод и руководство по настройке в документации проекта: scottmudge/ComfyUI-NAG.
RIFEInterpolation (#160)
- Вставляет высококачественные промежуточные кадры для улучшения плавности движения перед кодированием в видео. Используйте это, когда ваша базовая последовательность выглядит хорошо кадр за кадром, но кажется немного рваной при воспроизведении. Узел интегрирует реализацию RIFE, предоставленную расширением ComfyUI VFI. GACLove/ComfyUI-VFI
VHS_VideoCombine (#77)
- Обрабатывает финальное кодирование, монтирует опциональное аудио и сохраняет метаданные. Держите его формат и пиксельный формат согласованными между проектами для предсказуемого воспроизведения. VideoHelperSuite также питает утилиты быстрого предварительного просмотра последнего кадра, используемые в других местах на полотне. pythongosssss/ComfyUI-VideoHelperSuite
Опциональные дополнения#
- Используйте контрольные точки High vs Low SmoothMix для баланса качества и скорости. High идеально подходит для героических кадров и последней итерации, Low помогает вам быстрее итератировать на подсказках и времени.
- Держите ширину и высоту видео в кратных, дружественных к модели, для минимизации артефактов и ускорения выборки.
- Если клип T2V выглядит статичным, обновите семя или усилите глаголы движения в подсказке перед увеличением глубины выборки.
- Для F2LF выбирайте граничные кадры с похожими углами камеры и экспозицией. Большие прыжки в композиции сложнее разрешить плавно.
- Полотно включает помощник Adaptive Prompts для более богатых фразировок, когда вы хотите быстрые вариации без ручного переписывания подсказок. Alectriciti/comfyui-adaptiveprompts
Этот WAN 2.2 Smooth Workflow v5.0 был разработан, чтобы минимизировать трение при переключении режимов, сохраняя результаты гладкими и кинематографичными. Начните с режима, который соответствует вашему входу, установите размер и длительность, напишите четкую пару подсказок и дайте выборщикам и RIFE сделать остальное.
Благодарности#
Этот рабочий процесс реализует и основывается на следующих работах и ресурсах. Мы благодарны создателям Civitai за рабочий процесс Smooth Workflow Wan 2.2 AIO и модели Smooth Mix Wan 2.2 14B I2V/T2V, kijai за ComfyUI-WanVideoWrapper, и lightx2v (ModelTC) за Wan2.2-Distill-Loras за их вклад и поддержку. Для получения авторитетной информации, пожалуйста, обратитесь к оригинальной документации и репозиториям, указанным ниже.
Ресурсы#
- Civitai/Smooth Workflow Wan 2.2 AIO (Workflow v5.0)
- Документация / Примечания к выпуску: Источник рабочего процесса
- Civitai/Smooth Mix Wan 2.2 14B (I2V/T2V)
- Документация / Примечания к выпуску: Модели SmoothMix WAN 2.2 I2V/T2V
- kijai/ComfyUI-WanVideoWrapper
- GitHub: kijai/ComfyUI-WanVideoWrapper
- lightx2v/Wan2.2-Distill-Loras
- GitHub: ModelTC/LightX2V
- Hugging Face: lightx2v/Wan2.2-Distill-Loras
Примечание: Использование упомянутых моделей, наборов данных и кода подлежит соответствующим лицензиям и условиям, предоставленным их авторами и поддерживающими.


