Создание ПОЛНЫХ ИИ МИРОВ (Vace Wan 2.1) в ComfyUI

ComfyUI Generate ENTIRE AI WORLDS (Vace Wan 2.1) Рабочий процесс

Generate ENTIRE AI WORLDS (Vace Wan 2.1) in ComfyUI | Video World-Building

Хотите запустить этот рабочий процесс?

Полностью функциональные рабочие процессы
Нет недостающих узлов или моделей
Не требуется ручная настройка
Отличается потрясающей визуализацией

ComfyUI Generate ENTIRE AI WORLDS (Vace Wan 2.1) Примеры

Создание ПОЛНЫХ ИИ МИРОВ (Vace Wan 2.1): Кинематографическое построение мира видео на видео с настоящим отслеживанием камеры#

Создание ПОЛНЫХ ИИ МИРОВ (Vace Wan 2.1) — это готовый к производству рабочий процесс ComfyUI от Mickmumpitz для преобразования съемочных кадров в новые окружения, сохраняя оригинальное движение камеры. Он заменяет фоны, сохраняет перспективу и масштаб и композитирует замаскированного актера в полностью перерегенерированные миры, управляемые текстом и справочными изображениями.

Основанный на стеке Wan 2.1 VACE, этот рабочий процесс идеально подходит для кинематографистов, художников по визуальным эффектам и создателей, которым нужно быстрое превизуализация или отшлифованные кадры. Вы можете управлять сценой с помощью подсказок, начинать с необязательного справочного изображения и выбирать между высокоскоростным FP8 конвейером или низко-VRAM GGUF конвейером. Результатом является бесшовное построение мира, которое позволяет вам по-настоящему создавать ПОЛНЫЕ ИИ МИРЫ (Vace Wan 2.1) из повседневных пластин.

Основные модели в рабочем процессе Comfyui Создание ПОЛНЫХ ИИ МИРОВ (Vace Wan 2.1)#

Модель диффузии текста в видео Wan 2.1 14B. Основной генератор, используемый для синтеза нового мира последовательно. Перепакованные веса для ComfyUI доступны в выпуске Comfy-Org на Hugging Face. Comfy-Org/Wan_2.1_ComfyUI_repackaged
Модуль VACE Wan 2.1 14B. Обеспечивает VACE встраивания, связывающие генерацию со структурой сцены, позволяя точно заменить фон и отслеживать камеру. Kijai/WanVideo_comfy
VAE Wan 2.1. Обрабатывает латентное кодирование/декодирование для видеокадров. Comfy-Org/Wan_2.1_ComfyUI_repackaged (VAE split)
Текстовый кодировщик uMT5-XXL. Кодирует подсказки для пространства кондиционирования Wan 2.1. Пакетный кодировщик, совместимый с этим рабочим процессом, предоставляется вместе с разделами Wan 2.1. Comfy-Org/Wan_2.1_ComfyUI_repackaged (text_encoders)
Wan 2.1 14B VACE GGUF (квантованный UNet). Квантованный альтернативный вариант для графических процессоров с низким VRAM, который поддерживает путь GGUF без полной модели FP8. QuantStack/Wan2.1_14B_VACE-GGUF
FILM: Интерполяция кадров для большого движения. Необязательный постпроцесс для повышения плавности движения за счет интерполяции дополнительных кадров. google-research/frame-interpolation
Необязательная LightX LoRA для Wan 2.1. Ориентированная на скорость LoRA, которая хорошо сочетается с короткими шагами, сохраняя структуру и идентичность. Kijai/WanVideo_comfy (LoRA)

Как использовать рабочий процесс Comfyui Создание ПОЛНЫХ ИИ МИРОВ (Vace Wan 2.1)#

Этот рабочий процесс следует стратегии VACE в два прохода: сначала он кодирует движение сцены из контрольных изображений, чтобы зафиксировать движение камеры; затем он кодирует вставку актера и смешивает его с перерегенерированным окружением. Вы можете запустить путь FP8 для максимальной скорости или путь GGUF для низкого VRAM. Разделы ниже соответствуют группам на графе, поэтому вы можете с уверенностью управлять всей трубой Создание ПОЛНЫХ ИИ МИРОВ (Vace Wan 2.1).

ВХОД ВИДЕО И ВЫБОР РАЗМЕРА#

Входная область позволяет выбрать рабочее разрешение и основные элементы управления клипом. Используйте переключатель разрешения, чтобы выбрать предустановку (720p, 576p или 480p), которая подает Set_width (#370) и Set_height (#369), чтобы каждый этап оставался синхронизированным. Вы можете ограничить количество кадров, чтобы ускорить обороты, и установить небольшую пропускную способность, если вы хотите сместить начальную точку. Для стабильности и памяти держите последовательности в рекомендуемом диапазоне; метки графа указывают, что 81 кадр является разумным потолком для большинства графических процессоров. Эти выборы применяются глобально к контрольным изображениям, кодировкам VACE и финальным рендерам.

Примечание: входное видео также можно сгенерировать через другой рабочий процесс, MASK_AND_TRACK. Вы можете скачать его файл рабочего процесса здесь: workflow.json. После загрузки перетащите файл в новую вкладку рабочего процесса и запустите его, чтобы получить входное видео.

УСТАНОВКА ФОНА / СПРАВОЧНОЕ ИЗОБРАЖЕНИЕ#

Фоновая пластина и необязательное справочное изображение направляют визуальный стиль. Загрузите фоновое изображение, затем график изменит его размер так, чтобы он соответствовал вашему рабочему размеру. Если вы хотите использовать стиль вместо жесткой фоновой пластины, включите reference_image через селектор; это изображение направляет цвет, композицию и тон, не диктуя геометрию. Справочный маршрут полезен, когда вы хотите, чтобы модель Создавала ПОЛНЫЕ ИИ МИРЫ (Vace Wan 2.1), которые отзываются на определенный вид, в то время как текстовая подсказка обрабатывает остальное. Отключите его, когда предпочитаете только текстовое управление.

НАЧАЛЬНЫЙ КАДР + ПЕРСОНА#

Используйте этот раздел, чтобы решить, как начинается генерация. С готовым актерским изображением Image Remove Background Rembg (mtb) (#1433) извлекает чистую маску, а ImageCompositeMasked (#1441) размещает актера на выбранном вами фоне для формирования начального кадра. Переключатель Start Frame (ImpactSwitch, #1760) предлагает три режима: композитный актер плюс фон, только фон или без начального кадра. Начальные кадры помогают закрепить идентичность и макет; только фон позволяет персонажу "войти" со временем; без начального кадра модель просит установить как субъект, так и мир из текста и справки. Блок живого предварительного просмотра показывает, как это начало выглядит перед тем, как вы примете решение о дальнейшем.

КОНТРОЛЬНЫЕ ИЗОБРАЖЕНИЯ#

Контрольные изображения фиксируют движение камеры, чтобы перспектива и параллакс казались реальными. Вставьте видео с отслеживанием камеры в группу; график может извлечь слои OpenPose и Canny, а затем смешать их, чтобы создать сильный сигнал структуры. Переключатель Control Image Nodes (ImpactSwitch, #1032) позволяет выбрать только Track, Track+Pose, Canny+Pose или внешне подготовленное контрольное видео. Просмотрите стек с предварительным комбинированием, чтобы убедиться, что силуэты и края читаются четко. Для длинных последовательностей вы можете сохранить и позже перезагрузить это контрольное видео, чтобы избежать повторного вычисления; это особенно полезно, когда вы итерационно пробуете подсказки или маски, продолжая Создавать ПОЛНЫЕ ИИ МИРЫ (Vace Wan 2.1).

ВХОДНОЕ ВИДЕО CN#

Если вы уже экспортировали видео "контрольных изображений", поместите его сюда, чтобы обойти предварительную обработку. Выберите соответствующую опцию в переключателе контрольного изображения, чтобы остальная часть трубопровода использовала вашу кэшированную структуру. Это поддерживает согласованность отслеживания камеры между запусками и значительно сокращает время итерации на длинных дублях.

FP8 ЗАГРУЗЧИКИ МОДЕЛЕЙ#

Ветвь FP8 загружает полный стек моделей Wan 2.1. WanVideoModelLoader (#4) приносит в T2V 14B основу и модуль VACE, а также необязательную LightX LoRA для быстрого, согласованного выборки. WanVideoVAELoader (#26) поставляет VAE, а WanVideoBlockSwap (#5) открывает стратегию экономии VRAM, заменяя блоки в память устройства по мере необходимости. Эта ветвь является самым быстрым способом Создавать ПОЛНЫЕ ИИ МИРЫ (Vace Wan 2.1), если у вас есть достаточный VRAM.

FP8 ВЫБОРКА МОДЕЛЕЙ#

Подсказки кодируются WanVideoTextEncodeSingle для положительного и отрицательного текста, затем уточняются через WanVideoApplyNAG, чтобы сохранить согласованность фраз. Первый проход, WanVideo VACE Encode (CN‑CameraTrack) (#948), читает контрольные изображения, чтобы создать встраивания, осведомленные о движении. Второй проход, WanVideo VACE Encode (InsertPerson) (#1425), вводит актера, используя чистый альфа и маску, которую вы можете мягко увеличить или уменьшить, чтобы избежать гало. WanVideoSampler (#2) затем рендерит последовательность, WanVideoDecode (#1) превращает латенты в кадры, и простой переключатель выбирает между оригинальной частотой кадров или потоком FILM‑интерполяции перед окончательным объединением видео.

GGUF ЗАГРУЗЧИКИ МОДЕЛЕЙ#

Ветвь GGUF разработана для рабочих процессов с низким VRAM. UnetLoaderGGUF (#1677) загружает квантованный Wan 2.1 VACE UNet, CLIPLoader (#1680) предоставляет текстовый кодировщик, и LoRA можно применить с LoraLoader (#2420). Стандартный ComfyUI VAELoader (#1676) обрабатывает декодирование. Этот маршрут обменивает скорость на размер, сохраняя ту же логику VACE в два прохода, так что вы все еще можете Создавать ПОЛНЫЕ ИИ МИРЫ (Vace Wan 2.1) на скромном оборудовании.

GGUF ВЫБОРКА МОДЕЛЕЙ#

В квантованном пути WanVaceToVideo (#1724) преобразует встраивания VACE, текстовое кондиционирование и вашу справку в управляемый латент. WanVideoNAG и WanVideoEnhanceAVideoKJ помогают поддерживать идентичность и локальные детали, после чего KSampler (#1726) генерирует финальную латентную последовательность. VAEDecode (#1742) производит кадры, необязательный шаг FILM добавляет временную гладкость, и видео объединяет результат на диск. Используйте этот путь, когда VRAM ограничен или когда вам нужны длинные, устойчивые кадры.

ПОДСКАЗКИ#

Существует две панели подсказок. Сторона FP8 использует текстовый кодировщик Wan T5, в то время как сторона GGUF использует путь кондиционирования CLIP; обе получают положительный и отрицательный текст. Держите положительные подсказки кинематографичными и специфичными для мира, который вы хотите, и оставьте отрицательные подсказки для артефактов сжатия, переизбыточности и нежелательного переднего плана. Вы можете смешивать подсказки с мягким справочным изображением, чтобы управлять цветом и освещением, позволяя модели все еще создавать ПОЛНЫЕ ИИ МИРЫ (Vace Wan 2.1), которые соответствуют вашему намерению.

Основные узлы в рабочем процессе Comfyui Создание ПОЛНЫХ ИИ МИРОВ (Vace Wan 2.1)#

WanVideo VACE Encode (CN-CameraTrack) (#948) Первый этап VACE прохода, который анализирует ваши контрольные изображения, чтобы зафиксировать движение камеры. Соответствуйте ширине, высоте и длине с вашим выбранным рабочим размером и продолжительностью клипа, чтобы встраивания совпадали с выборкой ниже по потоку. Если вы полагаетесь на внешнее контрольное видео, поддерживайте его количество кадров, чтобы избежать дрейфа времени. Ссылка на реализацию и поведение узла следуют обертке WanVideo. Источник: kijai/ComfyUI-WanVideoWrapper
WanVideo VACE Encode (InsertPerson) (#1425) Второй этап VACE прохода, который вводит актера, используя альфа-мат и очищенную маску. Если вы видите слабые края, отрегулируйте уменьшение/расширение маски выше по потоку (DilateErodeMask, #2391), чтобы слегка подтянуть мат. Этот проход связывает вставку с движением сцены, чтобы масштаб и параллакс оставались естественными. Источник: kijai/ComfyUI-WanVideoWrapper
WanVaceToVideo (#1724 и #1729) Связывает кондиционирование VACE в выборку. Установите выходные размеры на тот же рабочий размер и используйте количество кадров контрольного клипа, чтобы обрезка не требовалась позже. Пара с одиночным справочным изображением, когда вы хотите, чтобы кадр имел единый вид, не переограничивая макет. Источник: kijai/ComfyUI-WanVideoWrapper
WanVideoSampler (#2) Выборка FP8, которая рендерит финальную последовательность из Wan 2.1, используя ваши текстовые встраивания и встраивания изображений VACE. Она поддерживает экономию VRAM с помощью замены блоков и хорошо работает с LightX step-distill LoRA для быстрых, безопасных для идентичности результатов при низких счетах шагов. Источники: kijai/ComfyUI-WanVideoWrapper, Kijai/WanVideo_comfy (LoRA)
KSampler (#1726) Выборка ветви GGUF. Начните с небольшого количества шагов, чтобы сохранить актера и снизить перенасыщение; LightX LoRA настроена для этого режима. Если детали размываются, увеличьте количество шагов умеренно или используйте блок Enhance A Video, чтобы восстановить микротекстуру без дрейфа движения. Источник: ComfyUI core
FILM VFI (#2019 и #1757) Необязательная интерполяция кадров, управляемая переключателем интерполяции. Используйте ее для сглаживания быстрого движения или увеличения продолжительности без повторногоjson

рендеринга. Если вы заметите временное колебание на тонких структурах, отключите его для этих кадров или уменьшите коэффициент интерполяции. Источник: google-research/frame-interpolation

Необязательные дополнения#

Держите длину клипов управляемой; руководство графа до примерно 81 кадра за запуск балансирует стабильность и память на общих графических процессорах.
Если вы итерационно пробуете подсказки, сохраните видео "контрольных изображений" один раз и переключитесь на путь Input CN Video, чтобы избежать повторного вычисления структуры.
Чтобы удалить слабые края вокруг субъекта, подкорректируйте маску актера с помощью DilateErodeMask в пути вставки, пока гало не исчезнет.
Низкий VRAM или длинные кадры: выберите ветвь GGUF; высокий VRAM и быстрая итерация: выберите ветвь FP8.
Для начальной рамки используйте "Только фон", когда вы хотите, чтобы субъект вошел позже, или "Без начальной рамки", когда вы хотите, чтобы модель полностью установила сцену из текста и справки.

С этими шагами вы можете уверенно запустить рабочий процесс от начала до конца и Создавать ПОЛНЫЕ ИИ МИРЫ (Vace Wan 2.1), которые выдержат под реальным движением камеры.

Благодарности#

Этот рабочий процесс реализует и строится на основе работ и ресурсов @mickmumpitz. Мы выражаем благодарность Mickmumpitz за обучающий рабочий процесс и благодарим его за вклад и поддержку. Для авторитетных деталей, пожалуйста, обратитесь к оригинальной документации и репозиториям, указанным ниже.

Ресурсы#

YouTube/Обучающий рабочий процесс
- Документация / Примечания к выпуску от Mickmumpitz на Youtube: Обучающий рабочий процесс

Примечание: Использование указанных моделей, наборов данных и кода подлежит соответствующим лицензиям и условиям, предоставленным Mickmumpitz.

Want More ComfyUI Workflows?

Wan 2.2 | Лидер в открытой генерации видео

Доступно сейчас! Лучшая точность + более плавное движение.

Wan 2.2 + Lightx2v V2 | Сверхбыстрое I2V & T2V

Двойная настройка Light LoRA, в 4 раза быстрее.

Wan 2.2 FLF2V | Генерация видео из первого и последнего кадров

Создавайте плавные видео из начального и конечного кадра с помощью Wan 2.2 FLF2V.

Wan 2.2 Lightning T2V I2V | 4-шаговая ультрабыстрая

Wan 2.2 теперь в 20 раз быстрее! T2V + I2V в 4 шага.

Wan 2.1 | Революционное создание видео

Создавайте невероятные видео из текста или изображений с прорывным ИИ, работающим на повседневных ЦП.

Hunyuan3D-2 | Продвинутый генератор 3D-объектов

Создайте точные текстурированные 3D-объекты из изображений с использованием передовых технологий ИИ.

Ace Step 1.5 | Генератор Музыки Коммерческого Уровня с ИИ

Преобразует текст в полные песни с умным планированием и мощью диффузии.

Nvidia Cosmos | Создание видео из текста и изображения

Создавайте видео из текстовых подсказок или интерполируйте кадры между двумя изображениями с помощью Cosmos от Nvidia.

Подписывайтесь на нас

Поддержка

Ресурсы

Юридическая информация

RunComfy

RunComfy - ведущая ComfyUI платформа, предлагающая ComfyUI онлайн среду и услуги, а также рабочие процессы ComfyUI с потрясающей визуализацией. RunComfy также предоставляет AI Models, позволяя художникам использовать новейшие инструменты AI для создания невероятного искусства.

Создание ПОЛНЫХ ИИ МИРОВ Видеопостроитель сцен