SeedVR2 V2.5 es un escalador de video e imagen de alta fidelidad que restaura detalles, afina texturas y mejora la consistencia temporal manteniendo el movimiento suave. Este flujo de trabajo de ComfyUI envuelve el transformador de difusión SeedVR2 y su VAE para que pueda escalar clips generados por IA, metraje de archivo o procesar renders en resultados más limpios y cinematográficos.
Diseñado para artistas y editores, el flujo de trabajo SeedVR2 V2.5 maneja tanto imágenes individuales como videos completos, incluyendo contenido RGBA, y preserva el audio original y la tasa de fotogramas al reensamblar el video escalado. Incluye aceleración opcional en tiempo de compilación y opciones de modelo que equilibran calidad, VRAM y velocidad.
SeedVR2 Diffusion Transformer 3B y 7B. Modelos de restauración de un solo paso que mejoran la resolución y la calidad perceptual al tiempo que mantienen la coherencia temporal. Use 3B para menor VRAM o tiempos de respuesta más rápidos y 7B cuando desee la mayor fidelidad. Vea las tarjetas de modelo oficiales y el documento para más detalles: ByteDance-Seed/SeedVR2-3B, ByteDance-Seed/SeedVR2-7B, y el documento de SeedVR2 sobre restauración de video de un solo paso arXiv:2506.05301.
SeedVR2 VAE (ema_vae_fp16). Codificador-Descodificador Variacional utilizado para codificar fotogramas al espacio latente y decodificar los resultados restaurados de nuevo a RGB con soporte de mosaico para grandes resoluciones. Distribuido con la integración ComfyUI: numz/SeedVR2_comfyUI.
Variantes cuantificadas opcionales. La integración comunitaria expone opciones FP8 y GGUF para reducir la memoria con algún compromiso de calidad o velocidad. Vea el repositorio de nodos ComfyUI SeedVR2 para las opciones actuales: ComfyUI-SeedVR2_VideoUpscaler.
Este gráfico tiene dos grupos independientes que comparten los mismos cargadores de modelo y lógica de escalado. Use el grupo de Imagen para imágenes fijas individuales. Use el grupo de Video para dividir un video en fotogramas y audio, escalar los fotogramas con SeedVR2 V2.5, luego reensamblar el clip con el audio y fps originales.
Cargue una imagen fija con LoadImage (#27). Si su imagen tiene transparencia, enrútela a través de JoinImageWithAlpha (#31) para que el canal alfa se preserve durante el escalado. Elija y cargue un punto de control DiT con SeedVR2LoadDiTModel (#28) y un VAE con SeedVR2LoadVAEModel (#29); los modelos se descargan automáticamente en el primer uso. Alimente la imagen en SeedVR2VideoUpscaler (#30) para escalar y restaurar; el nodo se centra en la recuperación de detalles y el afilado controlado que coincide con el aspecto de SeedVR2 V2.5. Guarde los resultados con SaveImage (#32). Para ejecuciones por lotes, puede habilitar SeedVR2TorchCompileSettings (#25) para compilar el gráfico una vez y acelerar los lotes subsecuentes.
Importe un clip con LoadVideo (#21), luego GetVideoComponents (#22) extrae fotogramas, audio y fps. Si sus fotogramas contienen alfa, únalo a través de JoinImageWithAlpha (#17) antes de escalar. Cargue su DiT y VAE elegidos con SeedVR2LoadDiTModel (#14) y SeedVR2LoadVAEModel (#13), luego escale el flujo de fotogramas con SeedVR2VideoUpscaler (#10). Reconstruya el video usando CreateVideo (#24), que pasa a través del audio y fps originales, y escriba el archivo con SaveVideo (#23). Para clips largos, SeedVR2TorchCompileSettings (#19) reduce el tiempo por iteración después de un paso de compilación inicial.
SeedVR2VideoUpscaler (#10 y #30)
Nodo central de restauración y escalado potenciado por SeedVR2. Establezca su objetivo de escalado ya sea por escala o dimensiones objetivo, y elija un tamaño de lote que se ajuste a su GPU. La consistencia temporal se logra procesando múltiples fotogramas vecinos juntos; la guía oficial señala que un lote de al menos 5 fotogramas activa la consistencia temporal para videos, con lotes más grandes mejorando la estabilidad si el VRAM lo permite ComfyUI-SeedVR2_VideoUpscaler. Para RGBA, asegúrese de que el camino alfa esté conectado río arriba. Si ve presión de memoria a altas resoluciones, reduzca la resolución objetivo o cambie a una variante de modelo más ligera.
SeedVR2LoadDiTModel (#14 y #28)
Carga el punto de control del transformador SeedVR2 y configura el dispositivo de inferencia. Elija entre 3B y 7B según su presupuesto de calidad y VRAM; FP16 ofrece la mejor fidelidad, mientras que FP8 o GGUF pueden ayudar en GPUs restringidas como expone la integración comunitaria numz/SeedVR2_comfyUI y el repositorio oficial de nodos ComfyUI ComfyUI-SeedVR2_VideoUpscaler. Mantenga el DiT en su GPU más rápida a menos que esté descargando explícitamente para memoria.
SeedVR2LoadVAEModel (#13 y #29)
Carga el VAE EMA utilizado para codificar y decodificar. Al apuntar a grandes salidas, habilite la codificación o decodificación en mosaico para reducir el pico de VRAM a un pequeño costo en velocidad; ajuste el tamaño y la superposición de mosaico solo si encuentra OOM o artefactos de borde. Descargar el VAE a la CPU u otra GPU puede liberar espacio para el DiT sin cambiar los resultados numz/SeedVR2_comfyUI.
SeedVR2TorchCompileSettings (#19 y #25)
Aceleración opcional que compila partes de la ruta SeedVR2 a un plan de kernel fusionado. La primera ejecución paga un costo de compilación, luego los lotes subsecuentes son más rápidos, lo cual es ideal para videos más largos o iteraciones repetidas ComfyUI-SeedVR2_VideoUpscaler.
audio y fps de GetVideoComponents (#22) conectadas a CreateVideo (#24).JoinImageWithAlpha antes del escalador para mantener los bordes nítidos en la composición.Este flujo de trabajo implementa y se basa en los siguientes trabajos y recursos. Agradecemos a numz por el ComfyUI-SeedVR2_VideoUpscaler (nodos/flujo de trabajo SeedVR2 v2.5), y AInVFX por el tutorial de video oficial SeedVR2 v2.5, por sus contribuciones y mantenimiento. Para detalles autorizados, consulte la documentación original y los repositorios enlazados a continuación.
Nota: El uso de los modelos, conjuntos de datos y código referenciados está sujeto a las respectivas licencias y términos proporcionados por sus autores y mantenedores.
RunComfy es la principal ComfyUI plataforma, ofreciendo ComfyUI en línea entorno y servicios, junto con flujos de trabajo de ComfyUI con impresionantes imágenes. RunComfy también ofrece AI Playground, permitiendo a los artistas aprovechar las últimas herramientas de AI para crear arte increíble.