Wan2.2 VACE Fun no ComfyUI | Fluxo de Trabalho de Animação de Imagem

Wan2.2 VACE Fun: Imagem de Referência para Vídeo Animado no ComfyUI

Wan2.2 VACE Fun é um fluxo de trabalho criativo, orientado por prompts, de referência para vídeo no ComfyUI. Forneça uma única imagem de referência e uma descrição de texto, e o gráfico anima seu sujeito em um vídeo coerente enquanto preserva a identidade e o estilo. Construído sobre o módulo Wan 2.2 VACE com um sampler em estágios, equilibra movimento, fidelidade e tempo de execução, tornando-o ideal para rolos de conceito, testes de personagens e clipes curtos de narração.

Este fluxo de trabalho ComfyUI Wan2.2 VACE Fun foca em três coisas: forte adesão ao sujeito a partir da imagem de referência, movimento expressivo guiado pelo seu prompt e exportação confiável para um vídeo MP4. Use-o quando precisar de iterações rápidas que ainda pareçam cinematográficas, ou quando quiser transformar uma imagem estática em uma cena dinâmica sem keyframing complexo.

Modelos-chave no fluxo de trabalho Comfyui Wan2.2 VACE Fun

Alibaba PAI Wan 2.2 VACE Fun A14B. O módulo VACE é o núcleo que transforma uma imagem de referência mais prompts em uma sequência latente pronta para vídeo. É projetado para animação orientada por sujeito e preservação de identidade. Model card
Wan 2.2 Text-to-Video A14B (HIGH/LOW). O fluxo de trabalho usa variantes HIGH e LOW em um pipeline de remoção de ruído em etapas para trocar velocidade e detalhe onde cada uma é mais eficaz. Pesos empacotados compatíveis com ComfyUI estão disponíveis aqui: Comfy-Org/Wan_2.2_ComfyUI_Repackaged
UMT5-XXL text encoder. Um grande codificador de texto multilíngue usado pelo Wan 2.x para compreensão de prompts; suporta prompts ricos em inglês e chinês. Veja os codificadores de texto repacotados em Comfy-Org/Wan_2.2_ComfyUI_Repackaged
Wan 2.1 VAE. Usado para decodificar os latentes finais do vídeo em quadros RGB antes da codificação. Disponível no mesmo pacote: Comfy-Org/Wan_2.2_ComfyUI_Repackaged

Como usar o fluxo de trabalho Comfyui Wan2.2 VACE Fun

O fluxo de trabalho é executado em estágios: você define controles globais, prepara a imagem de referência, escreve prompts, gera um vídeo latente condicionado por VACE, refina-o através de amostragem em estágios, depois decodifica e exporta. Os grupos são organizados para que você possa trabalhar de cima para baixo com o mínimo de atrito.

Configuração

Este grupo centraliza os controles que o restante do gráfico lê: width, height, length (quadros), fps, steps, sampling_shift e seed. Altere esses valores uma vez e todos os nós a jusante captam os valores via pares SetNode/GetNode. A resolução e o comprimento influenciam tanto a qualidade quanto o VRAM, enquanto o fps controla o movimento percebido no MP4 final. Mantenha width e height alinhados ao aspecto de sua imagem de referência para evitar distorção. A seed é exposta para reprodutibilidade em execuções.

Ref Img

Carregue seu sujeito com LoadImage (#118), depois a imagem é redimensionada em ImageResizeKJv2 (#112) para corresponder à sua resolução alvo. RMBG (#73) remove o fundo para que o VACE possa se fixar mais confiavelmente no sujeito do primeiro plano, ajudando na consistência da identidade entre os quadros. Um nó de visualização permite que você inspecione rapidamente o recorte antes da geração. A imagem processada é armazenada como referência e alimentada a jusante.

Prompt

Os prompts são codificados com CLIP Text Encode (Positive Prompt) (#56) e CLIP Text Encode (Negative Prompt) (#54) usando o codificador UMT5-XXL. Escreva verbos de ação claros, linguagem de câmera e contexto de cena no prompt positivo para direcionar movimento e composição. Use o prompt negativo para suprimir artefatos indesejados, estilos ou desordem; frases multilíngues funcionam bem. As saídas fornecem condicionamento rico para a etapa VACE e os samplers que seguem.

Modelos

O gráfico carrega os pesos Wan 2.2 T2V A14B e aplica o módulo Wan2.2 VACE Fun, depois aumenta a atenção e o agendamento para estabilidade. O ramo HIGH passa por PathchSageAttentionKJ (#8) e ModelSamplingSD3 (#57), enquanto o ramo LOW usa LoraLoaderModelOnly (#61), PathchSageAttentionKJ (#66) e ModelSamplingSD3 (#20). Esta divisão oferece um passe inicial de detalhes e um refinamento focado em movimento. Todas as escolhas de modelo são pré-configuradas; você simplesmente executa o gráfico quando suas configurações e prompts estão prontos.

Condição VACE

WanVaceToVideo (#43) injeta sua reference_image, condicionamento positivo/negativo e VAE, depois gera uma sequência de vídeo latente inicial dimensionada por width, height e length. Pense nisso como o momento em que a imagem estática "aprende" a se mover de acordo com seu prompt. O nó retorna ambos os fluxos de condicionamento para reutilização e um inteiro para o corte latente para manter o pipeline consistente em termos de quadros. Nenhuma máscara manual ou vídeo de controle é necessário, a menos que você queira experimentar.

Amostragem

Uma pilha de sampler de três estágios molda o resultado. O primeiro passe KSamplerAdvanced (#108) semeia a sequência latente para dicas gerais de composição e movimento. O segundo passe KSamplerAdvanced (#107) aprofunda o detalhe e a estabilidade temporal usando o mesmo condicionamento enquanto preserva o layout da cena. O passe final KSamplerAdvanced (#109) é executado na variante LOW para polir o movimento e reduzir artefatos, encontrando um equilíbrio prático entre velocidade e qualidade. TrimVideoLatent (#65) alinha os quadros ao comprimento alvo antes da decodificação.

Saída

VAEDecode (#19) transforma os latentes refinados em quadros RGB. VHS_VideoCombine (#69) então monta esses quadros em um MP4 na fps escolhida, salvando com um padrão de nome de arquivo sensato. Este grupo é otimizado para ciclos rápidos de revisão, para que você possa iterar em prompts, comprimento ou resolução sem tocar no restante do gráfico. Quando satisfeito, mantenha a mesma seed para repetibilidade ou mude-a para explorar variações.

Nós-chave no fluxo de trabalho Comfyui Wan2.2 VACE Fun

WanVaceToVideo (#43) O coração do Wan2.2 VACE Fun: vincula a semântica do prompt à sua imagem de referência e produz os latentes iniciais do vídeo. Ajuste width, height e length aqui através das configurações compartilhadas para corresponder ao seu objetivo criativo e orçamento de VRAM. Mantenha o sujeito de referência centralizado e bem iluminado para melhor retenção de identidade. Se o movimento parecer errado, revise o prompt positivo para enfatizar ações, movimentos de câmera e palavras de tempo.

KSamplerAdvanced (#108, #107, #109) Uma cadeia de samplers em estágios que melhora progressivamente a composição, o detalhe e a suavidade do movimento. Aumente os steps quando precisar de mais detalhes ou estabilidade temporal, e reutilize a mesma seed para comparar mudanças de forma justa. O passe final na variante LOW frequentemente limpa artefatos sutis; se os resultados parecerem muito suaves, desloque alguns passos para os passes anteriores. sampling_shift é exposto para ajustar o cronograma em direção a ênfase de movimento ou textura mais fina.

RMBG (#73) A remoção automática de fundo melhora a adesão ao sujeito para o Wan2.2 VACE Fun, especialmente com cenas ocupadas ou de baixo contraste. Use referências de alta qualidade e não borradas para minimizar erros de recorte. Se você quiser fundos naturais, substitua-os posteriormente em pós-produção ou componha uma placa atrás dos quadros decodificados.

TrimVideoLatent (#65) Mantém a sequência latente alinhada ao length solicitado. Se você estender ou encurtar um clipe, deixe este nó lidar com a contabilidade; ele evita desvios sutis de quadros através dos estágios de sampler.

VHS_VideoCombine (#69) Codifica os quadros finais para MP4. Ajuste frame_rate para controlar a duração do clipe em relação ao length (duração igual a quadros divididos por fps). Aumente a qualidade para entrega final ou diminua para pré-visualizações rápidas; qualidade mais alta aumenta o tamanho do arquivo e o tempo de codificação.

Extras opcionais

Comece com uma imagem de referência cujo aspecto corresponda ao seu width e height alvo para evitar distorções e cortes indesejados.
Escreva prompts que descrevam ação e movimento de câmera, não apenas aparência; Wan2.2 VACE Fun responde bem a verbos como "anda", "gira", "movimenta" e "inclina".
Mantenha length e fps sincronizados com seu objetivo: fps mais alto parece mais suave, mas encurta a duração total para a mesma contagem de quadros.
Se a identidade oscilar, simplifique o fundo via RMBG e adicione uma breve cláusula de identidade no prompt (roupa, cor ou equipamento).
Para rascunhos mais rápidos, reduza a resolução ou os passos, depois restaure-os para finais; mantenha a mesma seed para comparar versões de forma confiável.

Agradecimentos

Este fluxo de trabalho implementa e constrói sobre os seguintes trabalhos e recursos. Agradecemos a @BenjisAIPlayground pelo fluxo de trabalho “Wan2.2 VACE Fun Demo” e por suas contribuições e manutenção. Para detalhes autoritativos, consulte a documentação original e os repositórios vinculados abaixo.

Recursos

PWan2.2 VACE Fun Demo
- Docs / Release Notes @BenjisAIPlayground: YouTube

Nota: O uso dos modelos, conjuntos de dados e códigos referenciados está sujeito às respectivas licenças e termos fornecidos por seus autores e mantenedores.

Want More ComfyUI Workflows?

Wan 2.2 FLF2V | Geração de Vídeo Quadro-Inicial-Final

Gere vídeos suaves a partir de um quadro inicial e final usando Wan 2.2 FLF2V.

Wan 2.2 + Lightx2v V2 | Ultra Rápido I2V & T2V

Configuração Dual Light LoRA, 4X mais rápida.

Wan FusionX | T2V+I2V+VACE Completo

A solução de geração de vídeo mais poderosa até agora! Detalhe com qualidade de cinema, seu estúdio de cinema pessoal.

Flux Consistent Characters | Input Image

Crie personagens consistentes e garanta que eles pareçam uniformes usando suas imagens.

Audioreactive Dancers Evolved

Transforme seu sujeito com um fundo audioreativo feito de geometrías intrincadas.

SteadyDancer | Gerador Realista de Imagem-para-Vídeo

Transforma retratos em vídeos de movimento suave e realista instantaneamente.

Wonder3D | ComfyUI 3D Pack

Gere mapas normais de múltiplas vistas e imagens coloridas para ativos 3D.

Edição de Imagens Qwen | Edição de Fotos com IA Precisa

Edite fotos rapidamente com estilo, reiluminação e precisão no controle de objetos.

Suporte

Recursos

Legal

RunComfy

RunComfy é a principal ComfyUI plataforma, oferecendo ComfyUI online ambiente e serviços, juntamente com fluxos de trabalho do ComfyUI apresentando visuais impressionantes. RunComfy também oferece AI Models, permitindo que artistas utilizem as mais recentes ferramentas de AI para criar arte incrível.

Wan2.2 VACE Fun | Imagem para Vídeo Animado

Wan2.2 VACE Fun: Imagem de Referência para Vídeo Animado no ComfyUI

Modelos-chave no fluxo de trabalho Comfyui Wan2.2 VACE Fun

Como usar o fluxo de trabalho Comfyui Wan2.2 VACE Fun

Configuração

Ref Img

Prompt

Modelos

Condição VACE

Amostragem

Saída

Nós-chave no fluxo de trabalho Comfyui Wan2.2 VACE Fun

Extras opcionais

Agradecimentos

Recursos

Want More ComfyUI Workflows?

Wan 2.2 FLF2V | Geração de Vídeo Quadro-Inicial-Final

Wan 2.2 + Lightx2v V2 | Ultra Rápido I2V & T2V

Wan FusionX | T2V+I2V+VACE Completo

Flux Consistent Characters | Input Image

Audioreactive Dancers Evolved

SteadyDancer | Gerador Realista de Imagem-para-Vídeo

Wonder3D | ComfyUI 3D Pack

Edição de Imagens Qwen | Edição de Fotos com IA Precisa