SeedVR2 V2.5 è un upscaler di video e immagini ad alta fedeltà che ripristina i dettagli, affina le texture e migliora la coerenza temporale mantenendo il movimento fluido. Questo workflow ComfyUI avvolge il SeedVR2 diffusion transformer e il suo VAE, permettendoti di migliorare clip generate dall'AI, filmati d'archivio o render post-processati in risultati più puliti e cinematografici.
Progettato per artisti e editor, il workflow SeedVR2 V2.5 gestisce sia immagini singole che video completi, inclusi contenuti RGBA, e preserva l'audio originale e il frame rate durante il riassemblaggio del video migliorato. Include accelerazione opzionale a tempo di compilazione e scelte di modello che bilanciano qualità, VRAM e velocità.
SeedVR2 Diffusion Transformer 3B e 7B. Modelli di restauro a passo unico che migliorano la risoluzione e la qualità percettiva mantenendo la coerenza temporale. Usa 3B per minore VRAM o tempi di risposta più rapidi e 7B quando desideri la massima fedeltà. Vedi le schede modello ufficiali e il paper per i dettagli: ByteDance-Seed/SeedVR2-3B, ByteDance-Seed/SeedVR2-7B, e il paper SeedVR2 sul restauro video a passo unico arXiv:2506.05301.
SeedVR2 VAE (ema_vae_fp16). Autoencoder Variazionale utilizzato per codificare i fotogrammi nello spazio latente e decodificare i risultati restaurati in RGB con supporto per tiling per grandi risoluzioni. Distribuito con l'integrazione ComfyUI: numz/SeedVR2_comfyUI.
Varianti quantizzate opzionali. L'integrazione della community espone opzioni FP8 e GGUF per ridurre la memoria a qualche compromesso in qualità o velocità. Vedi il repository del nodo ComfyUI SeedVR2 per le opzioni attuali: ComfyUI-SeedVR2_VideoUpscaler.
Questo grafico ha due gruppi indipendenti che condividono gli stessi caricamenti di modelli e logica di upscaler. Usa il gruppo Immagine per singoli fermi immagine. Usa il gruppo Video per dividere un video in fotogrammi e audio, migliorare i fotogrammi con SeedVR2 V2.5, quindi riassemblare la clip con audio e fps originali.
Carica un fermo immagine con LoadImage (#27). Se la tua immagine ha trasparenza, instradala attraverso JoinImageWithAlpha (#31) in modo che il canale alfa venga preservato durante l'upscaling. Scegli e carica un checkpoint DiT con SeedVR2LoadDiTModel (#28) e un VAE con SeedVR2LoadVAEModel (#29); i modelli vengono scaricati automaticamente al primo utilizzo. Invia l'immagine a SeedVR2VideoUpscaler (#30) per migliorare e restaurare; il nodo si concentra sul recupero dei dettagli e sull'affinamento controllato che corrisponde all'aspetto di SeedVR2 V2.5. Salva i risultati con SaveImage (#32). Per esecuzioni batch, puoi abilitare SeedVR2TorchCompileSettings (#25) per compilare il grafico una volta e velocizzare i batch successivi.
Importa una clip con LoadVideo (#21), quindi GetVideoComponents (#22) estrae fotogrammi, audio e fps. Se i tuoi fotogrammi contengono alfa, uniscili tramite JoinImageWithAlpha (#17) prima di migliorare. Carica il tuo DiT e VAE scelti con SeedVR2LoadDiTModel (#14) e SeedVR2LoadVAEModel (#13), quindi migliora il flusso di fotogrammi con SeedVR2VideoUpscaler (#10). Ricostruisci il video usando CreateVideo (#24), che passa attraverso l'audio e fps originali, e scrivi il file con SaveVideo (#23). Per clip lunghe, SeedVR2TorchCompileSettings (#19) riduce il tempo per iterazione dopo un passaggio di compilazione iniziale.
SeedVR2VideoUpscaler (#10 e #30)
Nodo centrale di restauro e miglioramento alimentato da SeedVR2. Imposta il tuo obiettivo di upscaling target sia per scala che per dimensioni target, e scegli una dimensione batch che si adatti alla tua GPU. La coerenza temporale è guidata dall'elaborazione di più fotogrammi vicini insieme; le linee guida ufficiali notano che un batch di almeno 5 fotogrammi attiva la coerenza temporale per i video, con batch più grandi che migliorano la stabilità se la VRAM lo consente ComfyUI-SeedVR2_VideoUpscaler. Per RGBA, assicurati che il percorso alfa sia collegato a monte. Se vedi pressione sulla memoria ad alte risoluzioni, abbassa la risoluzione target o passa a una variante di modello più leggera.
SeedVR2LoadDiTModel (#14 e #28)
Carica il checkpoint del transformer SeedVR2 e configura il dispositivo di inferenza. Scegli tra 3B e 7B in base al tuo budget di qualità e VRAM; FP16 offre la migliore fedeltà, mentre FP8 o GGUF possono aiutare su GPU limitate come esposto dall'integrazione della community numz/SeedVR2_comfyUI e il repository ufficiale del nodo ComfyUI ComfyUI-SeedVR2_VideoUpscaler. Tieni il DiT sulla tua GPU più veloce a meno che non stai esplicitamente scaricando per memoria.
SeedVR2LoadVAEModel (#13 e #29)
Carica l'EMA VAE usato per codificare e decodificare. Quando si mirano grandi output, abilita la codifica o decodifica a tasselli per ridurre il picco di VRAM a un piccolo costo in velocità; regola la dimensione del tassello e la sovrapposizione solo se incontri OOM o artefatti ai bordi. Scaricare il VAE su CPU o un'altra GPU può liberare spazio per il DiT senza cambiare i risultati numz/SeedVR2_comfyUI.
SeedVR2TorchCompileSettings (#19 e #25)
Accelerazione opzionale che compila parti del percorso SeedVR2 in un piano kernel fuso. La prima esecuzione paga un costo di compilazione, quindi i batch successivi sono più veloci, il che è ideale per video più lunghi o iterazioni ripetute ComfyUI-SeedVR2_VideoUpscaler.
audio e fps da GetVideoComponents (#22) collegati a CreateVideo (#24).JoinImageWithAlpha prima del miglioramento per mantenere i bordi nitidi nel compositing.Questo workflow implementa e si basa sui seguenti lavori e risorse. Ringraziamo numz per il ComfyUI-SeedVR2_VideoUpscaler (nodi/workflow SeedVR2 v2.5), e AInVFX per il tutorial video ufficiale SeedVR2 v2.5, per i loro contributi e manutenzione. Per dettagli autorevoli, si prega di fare riferimento alla documentazione e ai repository originali collegati di seguito.
Nota: L'uso dei modelli, dataset e codice di riferimento è soggetto alle rispettive licenze e termini forniti dai loro autori e manutentori.
RunComfy è la piattaforma principale ComfyUI che offre ComfyUI online ambiente e servizi, insieme a workflow di ComfyUI con visuali mozzafiato. RunComfy offre anche AI Playground, consentire agli artisti di sfruttare gli ultimi strumenti di AI per creare arte incredibile.