SeedVR2 V2.5 é um upscaler de vídeo e imagem de alta fidelidade que restaura detalhes, aprimora texturas e melhora a consistência temporal, mantendo o movimento suave. Este fluxo de trabalho ComfyUI envolve o transformador de difusão SeedVR2 e seu VAE, permitindo que você faça upscaling de clipes gerados por IA, material de arquivo ou pós-processe renderizações em resultados mais limpos e cinematográficos.
Projetado para artistas e editores, o fluxo de trabalho SeedVR2 V2.5 lida com imagens únicas e vídeos completos, incluindo conteúdo RGBA, e preserva o áudio original e a taxa de quadros ao remontar o vídeo aprimorado. Inclui aceleração opcional em tempo de compilação e escolhas de modelos que equilibram qualidade, VRAM e velocidade.
SeedVR2 Diffusion Transformer 3B e 7B. Modelos de restauração de um passo que melhoram a resolução e a qualidade perceptual enquanto mantêm a coerência temporal. Use 3B para menor VRAM ou retorno mais rápido e 7B quando você deseja a maior fidelidade. Veja os cartões de modelo oficiais e o artigo para detalhes: ByteDance-Seed/SeedVR2-3B, ByteDance-Seed/SeedVR2-7B, e o artigo SeedVR2 sobre restauração de vídeo de um passo arXiv:2506.05301.
SeedVR2 VAE (ema_vae_fp16). Autoencoder Variacional usado para codificar quadros em espaço latente e decodificar os resultados restaurados de volta para RGB com suporte a mosaico para grandes resoluções. Distribuído com a integração ComfyUI: numz/SeedVR2_comfyUI.
Variantes quantizadas opcionais. A integração da comunidade expõe opções FP8 e GGUF para reduzir memória com algum compromisso de qualidade ou velocidade. Veja o repositório do nó ComfyUI SeedVR2 para opções atuais: ComfyUI-SeedVR2_VideoUpscaler.
Este gráfico possui dois grupos independentes que compartilham os mesmos carregadores de modelo e lógica de upscaler. Use o grupo de Imagem para fotos únicas. Use o grupo de Vídeo para dividir um vídeo em quadros e áudio, aprimorar os quadros com SeedVR2 V2.5, e então remontar o clipe com áudio e fps originais.
Carregue uma imagem estática com LoadImage (#27). Se sua imagem possui transparência, direcione-a através de JoinImageWithAlpha (#31) para que o canal alfa seja preservado durante o upscaling. Escolha e carregue um checkpoint DiT com SeedVR2LoadDiTModel (#28) e um VAE com SeedVR2LoadVAEModel (#29); os modelos são baixados automaticamente no primeiro uso. Alimente a imagem em SeedVR2VideoUpscaler (#30) para aprimorar e restaurar; o nó foca na recuperação de detalhes e nitidez controlada que combina com o visual do SeedVR2 V2.5. Salve os resultados com SaveImage (#32). Para execuções em lote, você pode habilitar SeedVR2TorchCompileSettings (#25) para compilar o gráfico uma vez e acelerar lotes subsequentes.
Importe um clipe com LoadVideo (#21), então GetVideoComponents (#22) extrai quadros, áudio e fps. Se seus quadros contêm alfa, mescle-o via JoinImageWithAlpha (#17) antes de aprimorar. Carregue seu DiT e VAE escolhidos com SeedVR2LoadDiTModel (#14) e SeedVR2LoadVAEModel (#13), então aprimore o fluxo de quadros com SeedVR2VideoUpscaler (#10). Reconstrua o vídeo usando CreateVideo (#24), que passa através do áudio e fps originais, e grave o arquivo com SaveVideo (#23). Para clipes longos, SeedVR2TorchCompileSettings (#19) reduz o tempo por iteração após um passo de compilação inicial.
SeedVR2VideoUpscaler (#10 e #30)
Nó central de restauração e upscaling alimentado pelo SeedVR2. Defina seu objetivo de upscale alvo, seja por escala ou dimensões alvo, e escolha um tamanho de lote que se adapte ao seu GPU. A consistência temporal é impulsionada pelo processamento de vários quadros vizinhos juntos; a orientação oficial observa que um lote de pelo menos 5 quadros ativa a consistência temporal para vídeos, com lotes maiores melhorando a estabilidade se o VRAM permitir ComfyUI-SeedVR2_VideoUpscaler. Para RGBA, certifique-se de que o caminho alfa está conectado a montante. Se você vir pressão de memória em altas resoluções, reduza a resolução alvo ou mude para uma variante de modelo mais leve.
SeedVR2LoadDiTModel (#14 e #28)
Carrega o checkpoint do transformador SeedVR2 e configura o dispositivo de inferência. Escolha entre 3B e 7B de acordo com seu orçamento de qualidade e VRAM; FP16 oferece a melhor fidelidade, enquanto FP8 ou GGUF podem ajudar em GPUs restritas, conforme exposto pela integração da comunidade numz/SeedVR2_comfyUI e o repositório oficial de nós ComfyUI ComfyUI-SeedVR2_VideoUpscaler. Mantenha o DiT no seu GPU mais rápido, a menos que você esteja explicitamente descarregando para memória.
SeedVR2LoadVAEModel (#13 e #29)
Carrega o EMA VAE usado para codificar e decodificar. Ao direcionar grandes saídas, habilite a codificação ou decodificação em mosaico para reduzir o pico de VRAM a um pequeno custo em velocidade; ajuste o tamanho do mosaico e a sobreposição apenas se você encontrar OOM ou artefatos de borda. Descarregar o VAE para CPU ou outro GPU pode liberar espaço para o DiT sem alterar os resultados numz/SeedVR2_comfyUI.
SeedVR2TorchCompileSettings (#19 e #25)
Aceleração opcional que compila partes do caminho SeedVR2 para um plano de kernel fundido. A primeira execução paga um custo de compilação, então lotes subsequentes são mais rápidos, o que é ideal para vídeos mais longos ou iterações repetidas ComfyUI-SeedVR2_VideoUpscaler.
audio e fps de GetVideoComponents (#22) conectadas a CreateVideo (#24).JoinImageWithAlpha antes do upscaler para manter as bordas nítidas na composição.Este fluxo de trabalho implementa e se baseia nos seguintes trabalhos e recursos. Agradecemos imensamente a numz pelo ComfyUI-SeedVR2_VideoUpscaler (nós/fluxo de trabalho SeedVR2 v2.5), e AInVFX pelo tutorial oficial de vídeo SeedVR2 v2.5, por suas contribuições e manutenção. Para detalhes autoritativos, consulte a documentação original e os repositórios vinculados abaixo.
Nota: O uso dos modelos, conjuntos de dados e código referenciados está sujeito às respectivas licenças e termos fornecidos por seus autores e mantenedores.
RunComfy é a principal ComfyUI plataforma, oferecendo ComfyUI online ambiente e serviços, juntamente com fluxos de trabalho do ComfyUI apresentando visuais impressionantes. RunComfy também oferece AI Playground, permitindo que artistas utilizem as mais recentes ferramentas de AI para criar arte incrível.