Wan 2.2 VBVR в ComfyUI | Контекстно-осведомленный рабочий процесс видеорассуждения

This workflow runs on Medium, Large, and X Large machines. 2X Large and larger machines are not supported and may crash ComfyUI due to OOM.

Wan 2.2 VBVR in ComfyUI Workflow

Wan 2.2 VBVR in ComfyUI | Context-Aware Video Reasoning Workflow

Хотите запустить этот рабочий процесс?

Полностью функциональные рабочие процессы
Нет недостающих узлов или моделей
Не требуется ручная настройка
Отличается потрясающей визуализацией

Wan 2.2 VBVR in ComfyUI Examples

Wan 2.2 VBVR в ComfyUI: создание изображений с учетом рассуждений#

Wan 2.2 VBVR в ComfyUI — это готовый к производству рабочий процесс, который приносит Video-Based Visual Reasoning в Wan 2.2 image-to-video. Он дополняет стандартный Wan 2.2 Mixture-of-Experts pipeline моделью, настроенной на рассуждения, и необязательным VBVR LoRA, чтобы ваши видео отслеживали объекты, действия и причинные события с более сильной временной логикой и согласованностью сцены.

Разработан для творческого направления, симуляции и сюжетных точек, которые требуют большего, чем просто красивые кадры, этот рабочий процесс ComfyUI выравнивает сложные подсказки с структурированным движением и взаимодействием нескольких объектов. Вы можете выбрать между чистым маршрутом модели VBVR или наложить VBVR и motion LoRAs на Wan 2.2 для скорости, затем экспортировать готовые к редактированию MP4.

Ключевые модели в рабочем процессе Comfyui Wan 2.2 VBVR#

Wan2.2-I2V-A14B (MoE основа). Два эксперта специализируются на фазах высокого шума и низкого шума и переключаются по SNR во время удаления шума, обеспечивая большую емкость без дополнительных затрат на каждый шаг. Это основной генератор, который рабочий процесс расширяет и смешивает. Model card • Technical details
VBVR-Wan2.2. Тонкая настройка Wan2.2-I2V-A14B на крупном наборе данных для видео-рассуждений, чтобы улучшить временные, причинные и многопредметные рассуждения, сохраняя архитектуру неизменной. Используйте это, когда вам нужно самое сильное выравнивание рассуждений. Model card • Paper
Wan 2.x VAE. Высококомпрессионный видеокодек, который эффективно восстанавливает кадры для рабочих процессов 480p–720p; Wan 2.2 описывает дизайн сжатия, который позволяет быструю генерацию 720p. Overview
uMT5-XXL текстовый энкодер. Надежный многоязычный энкодер семейства T5, используемый для извлечения встраиваний подсказок для текстовых и изображений-to-video каналов Wan 2.2. Model card
Motion и reasoning LoRAs для Wan 2.2. Рабочий процесс может загружать VBVR LoRA для предвзятости рассуждений и LightX2V step-distilled LoRAs для более сильной амплитуды движения и движений камеры. VBVR LoRA example • LightX2V collection

Как использовать рабочий процесс Comfyui Wan 2.2 VBVR#

Этот рабочий процесс предлагает три дополняющих маршрута. Каждый маршрут автономен от подсказок и необязательного начального изображения до вывода видео, так что вы можете протестировать все три и сохранить лучший дубль.

Маршрут модели VBVR
- Цель. Используйте это, когда вам нужно самое сильное видеорассуждение. Он запускает пару моделей Wan 2.2, откалиброванных по VBVR, с высоким SNR и низким SNR, разделяя график удаления шума между стадией "макет" и стадией "детали".
- Как это работает. Сначала запускается стадия высокого шума в WanVideoSampler (#173), затем ее латенты переходят в стадию низкого шума WanVideoSampler (#172), которая уточняет логику движения и детали. Переключение контролируется start_step и end_step семплеров, отражая передачу эксперта по SNR в Wan 2.2.
- Что вы устанавливаете. При необходимости предоставьте начальное изображение через LoadImage (#67) и напишите свою подсказку в узле Text рядом с энкодером, который питает WanVideoTextEncode (#170). Настройте количество кадров с помощью небольшого узла целых чисел рядом с семплерами (Int (#168)).
- Вывод. Кадры декодируются WanVideoDecode (#164) и собираются в MP4 с помощью VHS_VideoCombine (#176).
Маршрут Wan 2.2 + PainterI2V
- Цель. Быстрый, общий путь для кинематографического движения. Он сохраняет стандартные модели Wan 2.2 I2V, но обновляет условие изображения с помощью PainterI2VforKJ, чтобы исправить артефакты медленного движения, характерные для 4-шаговых LoRAs.
- Как это работает. Ваше начальное изображение изменяется для модели, встраивается с помощью PainterI2VforKJ (#181), затем семплируется WanVideoSampler (#129, #130). Маршрут использует передачу от высокого шума к низкому шуму, аналогичную VBVR, но придерживается стандартных весов Wan 2.2.
- Что вы устанавливаете. Укажите свою подсказку в узле Text, который питает WanVideoTextEncode (#152). Если вы соединяете LightX2V LoRA, это условие маршрута помогает сделать движение более намеренным. См. руководство по узлу для его целевой задачи. PainterI2VforKJ
- Вывод. Кадры декодируются WanVideoDecode (#142) и сохраняются с помощью VHS_VideoCombine (#154).
Маршрут Wan 2.2 + VBVR LoRA
- Цель. Гибрид для быстрых итераций. Он накладывает VBVR LoRA на модель Wan 2.2 с высоким уровнем шума и motion LoRA на модель с низким уровнем шума, предоставляя вам подсказку для рассуждений на раннем этапе и чистую полировку движения на позднем этапе.
- Как это работает. Поток высокого шума проходит через WanVideoSampler (#27), а поток низкого шума через WanVideoSampler (#90); оба получают текстовые встраивания из WanVideoTextEncode (#16) и необязательное условие изображения из PainterI2VforKJ (#179). LoRAs применяются на каждом этапе, чтобы соответствовать роли эксперта.
- Что вы устанавливаете. Вставьте свою подсказку в узел Text рядом с WanVideoTextEncode (#16) и, если необходимо, отрегулируйте разделение этапов с помощью близлежащих виджетов целых чисел, обозначенных как "Split_step". VBVR и LightX2V LoRAs можно выбрать из узлов LoRA в этой группе. VBVR LoRA
- Вывод. Кадры декодируются через WanVideoDecode (#28) и экспортируются через VHS_VideoCombine (#60).

Ключевые узлы в рабочем процессе Comfyui Wan 2.2 VBVR#

WanVideoModelLoader (#165, #162)
- Загружает модели Wan 2.2, откалиброванные по VBVR, с высоким SNR и низким SNR, которые соответствуют ранним и поздним экспертам по удалению шума. Держите пару согласованной, чтобы передача по SNR оставалась стабильной. См. дизайн MoE и SNR переключателя Wan 2.2 для контекста. Details
WanVideoSampler (#173, #172, #129, #130, #27, #90)
- Управляет генерацией и контролирует разделение эксперта. Регулируйте steps, чтобы сбалансировать детали и скорость, и настраивайте start_step или end_step, чтобы перемещать работу между ранним экспертом по макету и поздним экспертом по деталям. Используйте cfg, чтобы обменять соблюдение на свободу движения. Ссылка на реализацию находится в узлах семплера обертки. Wrapper repo
PainterI2VforKJ (#178, #181, #179)
- Заменяет стандартное условие изображение-видео на вариант с усилением движения, предназначенный для исправления медленного движения при использовании 4-шаговых LightX2V LoRAs. Он усиливает подсказки камеры и акцентирует действия, сохраняя идентичность субъекта. Node readme
WanVideoTextEncode (#170, #152, #16)
- Кодирует положительные и отрицательные подсказки через uMT5-XXL энкодер, чтобы семплеры получали богатую, многоязычную семантику. Держите структуру подсказки ясной; разделение сцены, субъекта, действия и намерения камеры обычно улучшает выравнивание. uMT5
VHS_VideoCombine (#176, #154, #60)
- Собирает декодированные кадры в MP4 с метаданными для воспроизводимости. Если вы передаете аудио, узел объединяет его с видео. Это исходит из утилитных узлов VideoHelperSuite. VideoHelperSuite

Дополнительные опции#

Когда выбрать каждый маршрут
- Модель VBVR: сложные взаимодействия, сцены причина-следствие или хореография нескольких объектов.
- Wan 2.2 + PainterI2V: динамическое движение или повествование, ориентированное на камеру, с LightX2V LoRAs.
- Wan 2.2 + VBVR LoRA: быстрые предварительные просмотры, которые все еще выигрывают от предвзятости рассуждений на раннем этапе удаления шума.
Советы по созданию подсказок для Wan 2.2 VBVR в ComfyUI
- Используйте короткие секции, такие как [SCENE], [SUBJECT], [ACTION], [CAMERA], [LIGHTING]. Это помогает текстовому энкодеру разделить намерение.
- Для взаимодействий объектов укажите, кто что делает кому и в каком порядке.
Стек LoRA
- Держите LoRA, ориентированный на рассуждения, на раннем эксперте и motion LoRA на позднем эксперте, чтобы избежать чрезмерной регуляризации деталей. Наборы VBVR и LightX2V, совместимые с Wan 2.2, доступны здесь: VBVR LoRA • LightX2V
Размер и соотношение сторон кадра
- Узлы ImageResizeKJv2 рядом с входами обеспечивают чистую делимость для VAE и уменьшают артефакты. Соответствуйте аспекту начального изображения целевому видео для более плавного распространения движения.

Благодарности#

Этот рабочий процесс реализует и основывается на следующих работах и ресурсах. Мы искренне благодарим @Ai Verse, автора Wan 2.2 VBVR в ComfyUI Source за их вклад и поддержку. Для получения авторитетных сведений, пожалуйста, обратитесь к оригинальной документации и репозиториям, указанным ниже.

Ресурсы#

YouTube/Wan 2.2 VBVR в ComfyUI Source
- Документы / Примечания к выпуску: Wan 2.2 VBVR в ComfyUI Source @Ai Verse

Примечание: Использование упомянутых моделей, наборов данных и кода подлежит соответствующим лицензиям и условиям, предоставленным их авторами и поддерживающими организациями.

Want More ComfyUI Workflows?

Wan 2.2 | Лидер в открытой генерации видео

Доступно сейчас! Лучшая точность + более плавное движение.

Wan 2.2 FLF2V | Генерация видео из первого и последнего кадров

Создавайте плавные видео из начального и конечного кадра с помощью Wan 2.2 FLF2V.

Wan 2.2 Lightning T2V I2V | 4-шаговая ультрабыстрая

Wan 2.2 теперь в 20 раз быстрее! T2V + I2V в 4 шага.

Wan 2.1 Control LoRA | Глубина и Плитка

Усовершенствуйте генерацию видео Wan 2.1 с помощью легких глубинных и плиточных LoRA для улучшения структуры и деталей.

LTX 2.3 IC-LoRA | Генератор видео AI с отслеживанием движения

Инструмент видео, управляемый движением V2V, для сверхточного создания AI без стиля

Эволюция Аудиореактивных Танцоров

Преобразуйте ваш объект с аудиореактивным фоном, состоящим из сложных геометрических фигур.

Стиль пергамента с Unsampling

Преобразуйте ваше видео в анимации в стиле пергамента, используя метод Unsampling.

LTX-2 ComfyUI | Генератор видео в реальном времени

Создавайте видео в реальном времени мгновенно, быстрее любого другого генератора.

Подписывайтесь на нас

Поддержка

Ресурсы

Юридическая информация

RunComfy

RunComfy - ведущая ComfyUI платформа, предлагающая ComfyUI онлайн среду и услуги, а также рабочие процессы ComfyUI с потрясающей визуализацией. RunComfy также предоставляет AI Models, позволяя художникам использовать новейшие инструменты AI для создания невероятного искусства.

Wan 2.2 VBVR в ComfyUI | Видео-основанное видеорассуждение