WAN 2.2 Smooth Workflow v5.0: um pipeline ComfyUI completo para vídeos suaves de 5 segundos#
WAN 2.2 Smooth Workflow v5.0 é uma única tela que cobre texto-para-vídeo, imagem-para-vídeo, animação de Primeiro-para-Último-Quadro e áudio-para-vídeo. É construído em torno da família de modelos SmoothMix WAN 2.2 com Lightx2v LoRAs opcionais, operadores WanVideoWrapper para WAN 2.x, e interpolação de quadros RIFE, permitindo gerar clipes curtos cinematográficos com movimento consistente e iteração rápida.
Use este WAN 2.2 Smooth Workflow v5.0 quando você quiser um gráfico organizado que permita alternar entre T2V, I2V, F2LF e A2V sem precisar reconfigurar nós. A tela inclui alternadores de modo, controles de duração e tamanho, pré-visualizações do último quadro, e um ramo de áudio opcional que pode seguir o ritmo visual do seu clipe.
Modelos principais no Comfyui WAN 2.2 Smooth Workflow v5.0#
- SmoothMix WAN 2.2 Text-para-Vídeo e Image-para-Vídeo checkpoints (Alto e Baixo)
- Função: principais bases de difusão para síntese de movimento e refinamento nos caminhos T2V e I2V. Alto favorece qualidade e detalhe; Baixo favorece velocidade e espaço de VRAM.
- Lightx2v WAN 2.2 Distill LoRAs
- Função: LoRAs opcionais destiladas para WAN 2.2 que melhoram a suavidade do movimento ou a estilização enquanto mantêm prompts responsivos. Carregue conforme necessário para direcionar aparência e dinâmica. lightx2v/Wan2.2-Distill-Loras
- WAN 2.x VAE
- Função: o VAE usado em toda a tela para codificar e decodificar latentes de vídeo, garantindo que a qualidade da imagem e a resposta de cor permaneçam consistentes entre os ramos.
- WAN 2.x text encoder (uMT5 XXL family)
- Função: o codificador de texto especializado usado por WAN 2.x; o fluxo de trabalho carrega o tokenizador/modelo correspondente para que os prompts condicionem adequadamente o movimento e a aparência.
- CLIP Vision encoder (ViT-H family)
- Função: extrai embeddings robustos de quadro inicial e final para o caminho de animação de Primeiro-para-Último-Quadro, melhorando a coerência temporal durante a interpolação.
- Ramo de geração de áudio
- Função: síntese de áudio consciente de quadros opcional que se condiciona no tempo visual e nos prompts de texto para criar elementos de trilha sonora alinhados com o corte visual.
- Interpolação de vídeo RIFE
- Função: aumenta a suavidade temporal e a taxa de quadros aparente ao inserir quadros intermediários de alta qualidade, ideal para loops curtos cinematográficos. Usado via a integração ComfyUI VFI. GACLove/ComfyUI-VFI
Como usar Comfyui WAN 2.2 Smooth Workflow v5.0#
A tela está organizada em quatro modos de produção que você pode habilitar a partir dos interruptores na tela. Em todos os modos, você verá grupos consistentes para Checkpoints, CLIP/VAE, Prompts, Tamanho e Duração do Vídeo, Amostragem e Resultado do Vídeo. Cada modo pode opcionalmente habilitar a geração de áudio via o alternador de Áudio.
Texto para Vídeo (T2V)#
Insira sua descrição no prompt Positivo e refine com um prompt Negativo. O texto do prompt é codificado em CLIPTextEncode (#90) e combinado com o WAN 2.x VAE. WanImageToVideo (#50) atua como o ponto de entrada T2V mesmo sem uma imagem inicial, produzindo uma sequência latente inicial que passa para os amostradores e depois para a decodificação. A interpolação RIFE RIFEInterpolation (#160) suaviza a sequência antes que VHS_VideoCombine (#77) exporte seu MP4. Use o Enabler de Áudio para gerar uma trilha sonora a partir de seus quadros e prompt de áudio.
Imagem para Vídeo (I2V)#
Solte uma única imagem no grupo IMAGE, depois defina suas dimensões e duração do vídeo. A imagem é redimensionada e enviada para WanImageToVideo (#172) juntamente com seus prompts de texto, que produzem um latente consciente de movimento. Amostradores emparelhados refinam o latente, então o resultado é decodificado, ampliado e interpolado para uma saída suave. Habilite o grupo de Áudio I2V se você quiser som gerado que corresponda ao conteúdo animado.
Animação de Primeiro para Último Quadro (F2LF)#
Forneça um quadro inicial e um quadro final. O gráfico codifica ambos com CLIP Vision e os passa para WanFirstLastFrameToVideo (#343), que planeja um caminho entre as primeiras e últimas imagens enquanto respeita seus prompts de texto. Os amostradores SmoothMix Alto e Baixo então esculpem os quadros intermediários antes da decodificação e interpolação. O resultado é exportado por VHS_VideoCombine (#332), e um ramo de áudio opcional pode sintetizar uma trilha sonora alinhada à transição visual.
Áudio para Vídeo (A2V)#
Carregue um clipe existente em VHS_LoadVideo (#145). O fluxo de trabalho pode opcionalmente interpolá-lo para suavidade extra, então o ramo de áudio cria som com base nos visuais e seu prompt de áudio. VHS_VideoCombine (#148) mistura a trilha e exporta um novo arquivo. Use a pré-visualização do último quadro na tela para verificar rapidamente a consistência visual antes da exportação.
Exportações e pré-visualizações do último quadro#
Cada modo termina com um grupo de Resultado de Vídeo que grava um MP4 através dos nós VHS_VideoCombine do VideoHelperSuite. Um painel dedicado de Último Quadro salva e pré-visualiza o quadro final para que você possa julgar iluminação, cor e qualidade do assunto rapidamente antes de executar gerações completas. As funcionalidades de E/S de vídeo e pré-visualização são fornecidas pelo VideoHelperSuite. pythongosssss/ComfyUI-VideoHelperSuite
Nós principais no Comfyui WAN 2.2 Smooth Workflow v5.0#
WanImageToVideo (#50)
- Este é o ponto de entrada de vídeo WAN 2.x para T2V e I2V dentro do WanVideoWrapper. Ele mescla seus prompts com o VAE (e uma imagem inicial opcional) para construir um latente de movimento inicial. Os controles de tamanho e comprimento a montante devem respeitar as restrições amigáveis ao modelo, e este nó alimenta os amostradores emparelhados que seguem. Detalhes da implementação do WanVideoWrapper e atualizações são mantidos aqui: kijai/ComfyUI-WanVideoWrapper.
WanFirstLastFrameToVideo (#343)
- Conduz o caminho de Primeiro-para-Último-Quadro ingerindo embeddings CLIP Vision para ambos os quadros de limite juntamente com seus prompts de texto. Ele cria uma trajetória guiada que preserva a identidade do sujeito e o layout da cena enquanto se transforma em direção ao alvo. Mantenha os quadros inicial e final alinhados na escala e composição do sujeito para as transições mais naturais.
KSamplerWithNAG (Avançado) (#234)
- Aplica Orientação Assistida por Ruído para melhorar a aderência ao prompt e reduzir a deriva temporal em clipes curtos. Ajuste sua orientação apenas quando você vir super-constrangimento ou sub-constrangimento; ele funciona em conjunto com o amostrador padrão e seu prompt negativo. Veja o método e orientação de ajuste nos documentos do projeto: scottmudge/ComfyUI-NAG.
RIFEInterpolation (#160)
- Insere intermediários de alta qualidade para melhorar a suavidade do movimento antes de codificar para vídeo. Use-o quando sua sequência base parecer boa quadro a quadro, mas parecer um pouco irregular na reprodução. O nó integra a implementação RIFE fornecida pela extensão ComfyUI VFI. GACLove/ComfyUI-VFI
VHS_VideoCombine (#77)
- Lida com a codificação final, mistura de áudio opcional e salvamento de metadados. Mantenha seu formato e formato de pixel consistentes em projetos para reprodução previsível. O VideoHelperSuite também alimenta as utilidades rápidas de pré-visualização do último quadro usadas em outros lugares na tela. pythongosssss/ComfyUI-VideoHelperSuite
Extras opcionais#
- Use checkpoints SmoothMix Alto vs Baixo para equilibrar qualidade e velocidade. Alto é ideal para tomadas principais e a última iteração, Baixo ajuda você a iterar mais rápido em prompts e tempo.
- Mantenha a largura e altura do vídeo em múltiplos amigáveis ao modelo para minimizar artefatos e acelerar a amostragem.
- Se um clipe T2V parecer estático, atualize a semente ou reforce verbos de movimento no prompt antes de aumentar a profundidade de amostragem.
- Para F2LF, escolha quadros de limite com ângulos de câmera e exposição semelhantes. Grandes saltos na composição são mais difíceis de resolver suavemente.
- A tela inclui um ajudante de Prompts Adaptativos para frases mais ricas quando você quiser variações rápidas sem reescrever manualmente os prompts. Alectriciti/comfyui-adaptiveprompts
Este WAN 2.2 Smooth Workflow v5.0 foi projetado para minimizar o atrito na troca de modos enquanto mantém os resultados suaves e cinematográficos. Comece com o modo que corresponde ao seu input, defina tamanho e duração, escreva um par de prompts claro, e deixe os amostradores mais RIFE fazerem o resto.
Agradecimentos#
Este fluxo de trabalho implementa e se baseia nos seguintes trabalhos e recursos. Agradecemos aos criadores do Civitai pelo fluxo de trabalho Smooth Workflow Wan 2.2 AIO e aos modelos Smooth Mix Wan 2.2 14B I2V/T2V, kijai por ComfyUI-WanVideoWrapper, e lightx2v (ModelTC) por Wan2.2-Distill-Loras por suas contribuições e manutenção. Para detalhes autoritativos, consulte a documentação original e os repositórios vinculados abaixo.
Recursos#
- Civitai/Smooth Workflow Wan 2.2 AIO (Workflow v5.0)
- Documentos / Notas de Lançamento: Fonte do Workflow
- Civitai/Smooth Mix Wan 2.2 14B (I2V/T2V)
- Documentos / Notas de Lançamento: SmoothMix WAN 2.2 I2V/T2V models
- kijai/ComfyUI-WanVideoWrapper
- GitHub: kijai/ComfyUI-WanVideoWrapper
- lightx2v/Wan2.2-Distill-Loras
- GitHub: ModelTC/LightX2V
- Hugging Face: lightx2v/Wan2.2-Distill-Loras
Nota: O uso dos modelos, conjuntos de dados e código referenciados está sujeito às respectivas licenças e termos fornecidos por seus autores e mantenedores.


