Gere MUNDOS INTEIROS DE IA (Vace Wan 2.1): Construção cinematográfica de mundo de vídeo para vídeo com rastreamento de câmera real
O Gere MUNDOS INTEIROS DE IA (Vace Wan 2.1) é um fluxo de trabalho do ComfyUI pronto para produção por Mickmumpitz para transformar filmagens ao vivo em novos ambientes enquanto mantém o movimento original da câmera. Ele troca fundos, preserva perspectiva e escala, e compõe um ator mascarado em mundos totalmente regenerados impulsionados por texto e imagens de referência.
Construído sobre a pilha Wan 2.1 VACE, este fluxo de trabalho é ideal para cineastas, artistas de VFX e criadores que precisam de previz rápida ou tomadas polidas. Você pode dirigir a cena com prompts, começar de uma imagem de referência opcional e escolher entre um pipeline FP8 de alta velocidade ou um pipeline GGUF de baixo VRAM. O resultado é uma construção de mundo perfeita que permite realmente Gerar MUNDOS INTEIROS DE IA (Vace Wan 2.1) a partir de placas do dia a dia.
Modelos-chave no fluxo de trabalho Comfyui Gere MUNDOS INTEIROS DE IA (Vace Wan 2.1)
- Modelo de difusão de texto para vídeo Wan 2.1 14B. Gerador principal usado para sintetizar o novo mundo de maneira temporalmente consistente. Pesos repacotados para ComfyUI estão disponíveis na versão Comfy-Org no Hugging Face. Comfy‑Org/Wan_2.1_ComfyUI_repackaged
- Módulo VACE Wan 2.1 14B. Fornece embeddings VACE que vinculam a geração à estrutura da cena, permitindo substituição precisa de fundo e rastreamento de câmera. Kijai/WanVideo_comfy
- VAE Wan 2.1. Lida com codificação/decodificação latente para quadros de vídeo. Comfy‑Org/Wan_2.1_ComfyUI_repackaged (VAE split)
- Codificador de texto uMT5‑XXL. Codifica prompts para o espaço de condicionamento do Wan 2.1. Um codificador empacotado compatível com este fluxo de trabalho é fornecido juntamente com as divisões Wan 2.1. Comfy‑Org/Wan_2.1_ComfyUI_repackaged (text_encoders)
- Wan 2.1 14B VACE GGUF (UNet quantizado). Uma alternativa quantizada para GPUs de baixo VRAM que alimenta o caminho GGUF sem o modelo FP8 completo. QuantStack/Wan2.1_14B_VACE‑GGUF
- FILM: Interpolação de Quadros para Grande Movimento. Processo pós-opcional para aumentar a suavidade do movimento interpolando quadros adicionais. google‑research/frame‑interpolation
- LightX opcional LoRA de destilação de etapas para Wan 2.1. Um LoRA orientado para velocidade que combina bem com contagens curtas de etapas enquanto mantém estrutura e identidade. Kijai/WanVideo_comfy (LoRA)
Como usar o fluxo de trabalho Comfyui Gere MUNDOS INTEIROS DE IA (Vace Wan 2.1)
Este fluxo de trabalho segue uma estratégia VACE de duas passagens: primeiro, ele codifica o movimento da cena a partir de imagens de controle para travar o movimento da câmera; em segundo lugar, ele codifica a inserção do ator e a mistura no ambiente regenerado. Você pode executar o caminho FP8 para máxima velocidade ou o caminho GGUF para baixo VRAM. As seções abaixo mapeiam para os grupos no gráfico, para que você possa operar todo o pipeline Gere MUNDOS INTEIROS DE IA (Vace Wan 2.1) com confiança.
ENTRADA DE VÍDEO E SELEÇÃO DE TAMANHO
A área de entrada permite escolher a resolução de trabalho e os controles básicos de clipe. Use o interruptor de resolução para escolher um predefinido (720p, 576p ou 480p), que alimenta Set_width (#370) e Set_height (#369) para que cada estágio permaneça sincronizado. Você pode limitar o número de quadros para manter as voltas rápidas e definir um pequeno salto se quiser compensar o ponto de entrada. Para estabilidade e memória, mantenha as sequências dentro da faixa recomendada; os rótulos do gráfico indicam que 81 quadros é um teto sensato para a maioria das GPUs. Essas escolhas se aplicam globalmente para imagens de controle, codificações VACE e renderizações finais.
Nota: O vídeo de entrada também pode ser gerado através de outro fluxo de trabalho, MASK_AND_TRACK. Você pode baixar seu arquivo de fluxo de trabalho aqui: workflow.json. Após o download, arraste o arquivo para uma nova aba de fluxo de trabalho e execute-o para obter o vídeo de entrada.
DEFINIR FUNDO / IMAGEM DE REFERÊNCIA
Uma placa de fundo e uma imagem de referência opcional guiam o estilo visual. Carregue uma imagem estática de fundo, então o gráfico a redimensiona para corresponder ao seu tamanho de trabalho. Se você quiser um âncora de estilo em vez de uma placa de fundo rígida, ative a reference_image através do seletor; esta imagem guia cor, composição e tom sem ditar geometria. A rota de referência é útil quando você deseja que o modelo Gere MUNDOS INTEIROS DE IA (Vace Wan 2.1) que ecoem um visual específico, enquanto o prompt de texto lida com o restante. Desative-o quando preferir controle apenas por texto.
INICIAR QUADRO + PESSOA
Use esta seção para decidir como a geração começa. Com um ator pronto, Image Remove Background Rembg (mtb) (#1433) puxa uma máscara limpa e ImageCompositeMasked (#1441) coloca o ator no fundo escolhido para formar um quadro inicial. O interruptor Start Frame (ImpactSwitch, #1760) oferece três modos: ator composto mais fundo, apenas fundo ou sem quadro inicial. Quadros iniciais ajudam a ancorar identidade e layout; apenas fundo permite que o personagem "entre" ao longo do tempo; sem quadro inicial pede ao modelo que estabeleça tanto o sujeito quanto o mundo a partir de texto e referência. Um bloco de visualização ao vivo mostra como esse início se parece antes de você confirmar a jusante.
IMAGENS DE CONTROLE
As imagens de controle travam o movimento da câmera para que perspectiva e paralaxe pareçam reais. Alimente um vídeo rastreado por câmera no grupo; o gráfico pode derivar camadas OpenPose e Canny, depois misturá-las para criar um forte sinal de estrutura. O interruptor Control Image Nodes (ImpactSwitch, #1032) permite escolher apenas Trilha, Trilha+Pose, Canny+Pose ou um vídeo de controle preparado externamente. Revise a pilha com a combinação de visualização para garantir que silhuetas e bordas sejam lidas claramente. Para sequências longas, você pode salvar e recarregar este vídeo de controle para evitar recomputação; isso é especialmente útil quando você itera prompts ou máscaras enquanto continua a Gerar MUNDOS INTEIROS DE IA (Vace Wan 2.1).
VÍDEO DE ENTRADA CN
Se você já exportou um vídeo de "imagens de controle", coloque-o aqui para contornar o pré-processamento. Selecione a opção correspondente no interruptor de imagem de controle para que o restante do pipeline use sua estrutura em cache. Isso mantém o rastreamento da câmera consistente em execuções e reduz drasticamente o tempo de iteração em tomadas longas.
CARREGADORES DE MODELO FP8
O ramo FP8 carrega toda a pilha de modelos Wan 2.1. WanVideoModelLoader (#4) traz a espinha dorsal T2V 14B e o módulo VACE, além de um LightX LoRA opcional para amostragem rápida e coerente. WanVideoVAELoader (#26) fornece o VAE, e WanVideoBlockSwap (#5) expõe uma estratégia de economia de VRAM trocando blocos para a memória do dispositivo conforme necessário. Este ramo é a maneira mais rápida de Gerar MUNDOS INTEIROS DE IA (Vace Wan 2.1) quando você tem espaço de VRAM.
AMOSTRADOR DE MODELO FP8
Os prompts são codificados por WanVideoTextEncodeSingle para texto positivo e negativo, depois refinados através de WanVideoApplyNAG para manter a consistência das frases. A primeira passagem, WanVideo VACE Encode (CN‑CameraTrack) (#948), lê as imagens de controle para produzir embeddings conscientes de movimento. A segunda passagem, WanVideo VACE Encode (InsertPerson) (#1425), injeta o ator usando um alfa limpo e uma máscara que você pode aumentar ou diminuir suavemente para evitar halos. WanVideoSampler (#2) então renderiza a sequência, WanVideoDecode (#1) transforma latentes em quadros, e um interruptor simples escolhe entre a taxa de quadros original ou um fluxo interpolado FILM antes da combinação final de vídeo.
CARREGADORES DE MODELO GGUF
O ramo GGUF é projetado para fluxos de trabalho de baixo VRAM. UnetLoaderGGUF (#1677) carrega um UNet VACE Wan 2.1 quantizado, CLIPLoader (#1680) fornece o codificador de texto, e um LoRA pode ser aplicado com LoraLoader (#2420). Um VAELoader padrão do ComfyUI (#1676) lida com a decodificação. Esta rota troca velocidade por pegada enquanto preserva a mesma lógica de duas passagens VACE, para que você ainda possa Gerar MUNDOS INTEIROS DE IA (Vace Wan 2.1) em hardware modesto.
AMOSTRADOR DE MODELO GGUF
No caminho quantizado, WanVaceToVideo (#1724) transforma embeddings VACE, condicionamento de texto e sua referência em um latente guiado. WanVideoNAG e WanVideoEnhanceAVideoKJ ajudam a manter identidade e detalhe local, após o que KSampler (#1726) gera a sequência latente final. VAEDecode (#1742) produz quadros, uma etapa FILM opcional adiciona suavidade temporal, e a combinação de vídeo grava o resultado no disco. Use este caminho quando o VRAM estiver apertado ou quando precisar de tomadas longas e estáveis.
PROMPTS
Existem dois painéis de prompt. O lado FP8 usa o codificador de texto Wan T5, enquanto o lado GGUF usa um caminho de condicionamento CLIP; ambos recebem texto positivo e negativo. Mantenha os prompts positivos cinematográficos e específicos para o mundo que deseja, e reserve prompts negativos para artefatos de compressão, super-saturação e desordem indesejada em primeiro plano. Você pode misturar prompts com uma imagem de referência suave para direcionar cor e iluminação enquanto ainda permite que o modelo Gere MUNDOS INTEIROS DE IA (Vace Wan 2.1) que correspondam à sua intenção.
Nós-chave no fluxo de trabalho Comfyui Gere MUNDOS INTEIROS DE IA (Vace Wan 2.1)
WanVideo VACE Encode (CN-CameraTrack)(#948) Passagem VACE de primeira etapa que analisa suas imagens de controle para travar o movimento da câmera. Combine largura, altura e comprimento com o tamanho de trabalho escolhido e duração do clipe para que os embeddings se alinhem com a amostragem a jusante. Se você se baseia em vídeo de controle externo, mantenha sua contagem de quadros consistente para evitar desvios de tempo. Implementação de referência e comportamento do nó seguem o wrapper WanVideo. Fonte: kijai/ComfyUI‑WanVideoWrapperWanVideo VACE Encode (InsertPerson)(#1425) Passagem VACE de segunda etapa que injeta o ator usando a máscara alfa e uma máscara limpa. Se você vir bordas tênues, ajuste a máscara de encolhimento/expansão upstream (DilateErodeMask, #2391) para puxar a máscara ligeiramente. Esta passagem amarra a inserção ao movimento da cena para que escala e paralaxe permaneçam naturais. Fonte: kijai/ComfyUI‑WanVideoWrapperWanVaceToVideo(#1724 e #1729) Conecta o condicionamento VACE ao amostrador. Defina as dimensões de saída para o mesmo tamanho de trabalho e use a contagem de quadros do clipe de controle para que cortes não sejam necessários mais tarde. Emparelhe com uma única imagem de referência quando quiser um visual coeso em toda a tomada sem restringir demais o layout. Fonte: kijai/ComfyUI‑WanVideoWrapperWanVideoSampler(#2) Amostrador FP8 que renderiza a sequência final do Wan 2.1 usando seus embeddings de texto e embeddings de imagem VACE. Ele oferece suporte a troca de blocos para economia de VRAM e funciona bem com o LightX step-distill LoRA para resultados rápidos e seguros em baixas contagens de etapas. Fontes: kijai/ComfyUI‑WanVideoWrapper, Kijai/WanVideo_comfy (LoRA)KSampler(#1726) Amostrador do ramo GGUF. Comece com um pequeno número de etapas para preservar o ator e reduzir o excesso de nitidez; o LightX LoRA é ajustado para este regime. Se o detalhe se perder, aumente as etapas modestamente ou intensifique o blocoEnhance A Videopara recuperar micro-textura sem desviar o movimento. Fonte: ComfyUI coreFILM VFI(#2019 e #1757) Interpolação de quadros opcional controlada pelo interruptor de interpolação. Use-o para suavizar movimentos rápidos ou estender a duração sem re-renderização. Se você notar oscilação temporal em estruturas finas, desative-o para essas tomadas ou reduza o fator de interpolação. Fonte: google‑research/frame‑interpolation
Extras opcionais
- Mantenha os comprimentos dos clipes gerenciáveis; a orientação do gráfico de até aproximadamente 81 quadros por execução equilibra estabilidade e memória em GPUs comuns.
- Se você estiver iterando prompts, salve o vídeo de "imagens de controle" uma vez e mude para o caminho de Vídeo de Entrada CN para evitar recomputação de estrutura.
- Para remover bordas tênues ao redor do sujeito, ajuste a máscara do ator com
DilateErodeMaskno caminho de inserção até que os halos desapareçam. - Baixa VRAM ou tomadas longas: escolha o ramo GGUF; alta VRAM e iteração rápida: escolha o ramo FP8.
- Para enquadramento inicial, use "Apenas fundo" quando quiser que o sujeito entre mais tarde, ou "Sem quadro inicial" quando quiser que o modelo estabeleça totalmente a cena a partir de texto e referência.
Com essas etapas, você pode executar o fluxo de trabalho de ponta a ponta com confiança e Gerar MUNDOS INTEIROS DE IA (Vace Wan 2.1) que se sustentam sob movimento real de câmera.
Agradecimentos
Este fluxo de trabalho implementa e se baseia nos trabalhos e recursos de @mickmumpitz. Agradecemos imensamente o Tutorial de Fluxo de Trabalho de Mickmumpitz pelo fluxo de trabalhojson , e agradecemos a ele por suas contribuições e manutenção. Para detalhes autoritativos, consulte a documentação original e os repositórios vinculados abaixo.
Recursos
- YouTube/Tutorial de Fluxo de Trabalho
- Documentos / Notas de Lançamento do Youtube de Mickmumpitz: Tutorial de Fluxo de Trabalho
Nota: O uso dos modelos, conjuntos de dados e códigos referenciados está sujeito às respectivas licenças e termos fornecidos por Mickmumpitz.
