Fluxo de trabalho de upscaling de vídeo SeedVR2 V2.5 para ComfyUI
SeedVR2 V2.5 é um upscaler de vídeo e imagem de alta fidelidade que restaura detalhes, aprimora texturas e melhora a consistência temporal, mantendo o movimento suave. Este fluxo de trabalho ComfyUI envolve o transformador de difusão SeedVR2 e seu VAE, permitindo que você faça upscaling de clipes gerados por IA, material de arquivo ou pós-processe renderizações em resultados mais limpos e cinematográficos.
Projetado para artistas e editores, o fluxo de trabalho SeedVR2 V2.5 lida com imagens únicas e vídeos completos, incluindo conteúdo RGBA, e preserva o áudio original e a taxa de quadros ao remontar o vídeo aprimorado. Inclui aceleração opcional em tempo de compilação e escolhas de modelos que equilibram qualidade, VRAM e velocidade.
Modelos principais no fluxo de trabalho ComfyUI SeedVR2 V2.5
- SeedVR2 Diffusion Transformer 3B e 7B. Modelos de restauração de um passo que melhoram a resolução e a qualidade perceptual enquanto mantêm a coerência temporal. Use 3B para menor VRAM ou retorno mais rápido e 7B quando você deseja a maior fidelidade. Veja os cartões de modelo oficiais e o artigo para detalhes: ByteDance-Seed/SeedVR2-3B, ByteDance-Seed/SeedVR2-7B, e o artigo SeedVR2 sobre restauração de vídeo de um passo arXiv:2506.05301.
- SeedVR2 VAE (ema_vae_fp16). Autoencoder Variacional usado para codificar quadros em espaço latente e decodificar os resultados restaurados de volta para RGB com suporte a mosaico para grandes resoluções. Distribuído com a integração ComfyUI: numz/SeedVR2_comfyUI.
- Variantes quantizadas opcionais. A integração da comunidade expõe opções FP8 e GGUF para reduzir memória com algum compromisso de qualidade ou velocidade. Veja o repositório do nó ComfyUI SeedVR2 para opções atuais: ComfyUI-SeedVR2_VideoUpscaler.
Como usar o fluxo de trabalho ComfyUI SeedVR2 V2.5
Este gráfico possui dois grupos independentes que compartilham os mesmos carregadores de modelo e lógica de upscaler. Use o grupo de Imagem para fotos únicas. Use o grupo de Vídeo para dividir um vídeo em quadros e áudio, aprimorar os quadros com SeedVR2 V2.5, e então remontar o clipe com áudio e fps originais.
Grupo de Imagem
Carregue uma imagem estática com LoadImage (#27). Se sua imagem possui transparência, direcione-a através de JoinImageWithAlpha (#31) para que o canal alfa seja preservado durante o upscaling. Escolha e carregue um checkpoint DiT com SeedVR2LoadDiTModel (#28) e um VAE com SeedVR2LoadVAEModel (#29); os modelos são baixados automaticamente no primeiro uso. Alimente a imagem em SeedVR2VideoUpscaler (#30) para aprimorar e restaurar; o nó foca na recuperação de detalhes e nitidez controlada que combina com o visual do SeedVR2 V2.5. Salve os resultados com SaveImage (#32). Para execuções em lote, você pode habilitar SeedVR2TorchCompileSettings (#25) para compilar o gráfico uma vez e acelerar lotes subsequentes.
Grupo de Vídeo
Importe um clipe com LoadVideo (#21), então GetVideoComponents (#22) extrai quadros, áudio e fps. Se seus quadros contêm alfa, mescle-o via JoinImageWithAlpha (#17) antes de aprimorar. Carregue seu DiT e VAE escolhidos com SeedVR2LoadDiTModel (#14) e SeedVR2LoadVAEModel (#13), então aprimore o fluxo de quadros com SeedVR2VideoUpscaler (#10). Reconstrua o vídeo usando CreateVideo (#24), que passa através do áudio e fps originais, e grave o arquivo com SaveVideo (#23). Para clipes longos, SeedVR2TorchCompileSettings (#19) reduz o tempo por iteração após um passo de compilação inicial.
Nós principais no fluxo de trabalho ComfyUI SeedVR2 V2.5
SeedVR2VideoUpscaler (#10 e #30) Nó central de restauração e upscaling alimentado pelo SeedVR2. Defina seu objetivo de upscale alvo, seja por escala ou dimensões alvo, e escolha um tamanho de lote que se adapte ao seu GPU. A consistência temporal é impulsionada pelo processamento de vários quadros vizinhos juntos; a orientação oficial observa que um lote de pelo menos 5 quadros ativa a consistência temporal para vídeos, com lotes maiores melhorando a estabilidade se o VRAM permitir ComfyUI-SeedVR2_VideoUpscaler. Para RGBA, certifique-se de que o caminho alfa está conectado a montante. Se você vir pressão de memória em altas resoluções, reduza a resolução alvo ou mude para uma variante de modelo mais leve.
SeedVR2LoadDiTModel (#14 e #28) Carrega o checkpoint do transformador SeedVR2 e configura o dispositivo de inferência. Escolha entre 3B e 7B de acordo com seu orçamento de qualidade e VRAM; FP16 oferece a melhor fidelidade, enquanto FP8 ou GGUF podem ajudar em GPUs restritas, conforme exposto pela integração da comunidade numz/SeedVR2_comfyUI e o repositório oficial de nós ComfyUI ComfyUI-SeedVR2_VideoUpscaler. Mantenha o DiT no seu GPU mais rápido, a menos que você esteja explicitamente descarregando para memória.
SeedVR2LoadVAEModel (#13 e #29) Carrega o EMA VAE usado para codificar e decodificar. Ao direcionar grandes saídas, habilite a codificação ou decodificação em mosaico para reduzir o pico de VRAM a um pequeno custo em velocidade; ajuste o tamanho do mosaico e a sobreposição apenas se você encontrar OOM ou artefatos de borda. Descarregar o VAE para CPU ou outro GPU pode liberar espaço para o DiT sem alterar os resultados numz/SeedVR2_comfyUI.
SeedVR2TorchCompileSettings (#19 e #25) Aceleração opcional que compila partes do caminho SeedVR2 para um plano de kernel fundido. A primeira execução paga um custo de compilação, então lotes subsequentes são mais rápidos, o que é ideal para vídeos mais longos ou iterações repetidas ComfyUI-SeedVR2_VideoUpscaler.
Extras opcionais
- Escolha o modelo que corresponda ao seu trabalho: 3B para velocidade ou VRAM limitada, 7B quando o detalhe absoluto é importante SeedVR2-3B, SeedVR2-7B.
- Preserve áudio e temporização mantendo as saídas
audioefpsdeGetVideoComponents(#22) conectadas aCreateVideo(#24). - Para conteúdo pesado com transparência, certifique-se de que o alfa está mesclado via
JoinImageWithAlphaantes do upscaler para manter as bordas nítidas na composição. - Se você enfrentar OOM, tente uma resolução de saída mais baixa, mude para o modelo 3B, habilite o mosaico VAE, ou use um checkpoint quantizado onde disponível numz/SeedVR2_comfyUI.
- Para um entendimento mais profundo de como o SeedVR2 alcança a restauração de um passo com atenção de janela adaptativa e pós-treinamento adversarial, veja o artigo arXiv:2506.05301 e a implementação de referência IceClear/SeedVR2.
Agradecimentos
Este fluxo de trabalho implementa e se baseia nos seguintes trabalhos e recursos. Agradecemos imensamente a numz pelo ComfyUI-SeedVR2_VideoUpscaler (nós/fluxo de trabalho SeedVR2 v2.5), e AInVFX pelo tutorial oficial de vídeo SeedVR2 v2.5, por suas contribuições e manutenção. Para detalhes autoritativos, consulte a documentação original e os repositórios vinculados abaixo.
Recursos
- Fonte SeedVR2 V2.5: https://www.reddit.com/r/comfyui/comments/1ordkfc/seedvr2_v25_released_complete_redesign_with_gguf
- GitHub: numz/ComfyUI-SeedVR2_VideoUpscaler
- Documentação / Notas de Lançamento: Post no Reddit
- Demonstração SeedVR2 V2.5 no Youtube: https://www.youtube.com/watch?v=MBtWYXq_r60
- Documentação / Notas de Lançamento @AInVFX: Vídeo no YouTube
Nota: O uso dos modelos, conjuntos de dados e código referenciados está sujeito às respectivas licenças e termos fornecidos por seus autores e mantenedores.

