Flujo de trabajo de escalado de video SeedVR2 V2.5 para ComfyUI
SeedVR2 V2.5 es un escalador de video e imagen de alta fidelidad que restaura detalles, afina texturas y mejora la consistencia temporal manteniendo el movimiento suave. Este flujo de trabajo de ComfyUI envuelve el transformador de difusión SeedVR2 y su VAE para que pueda escalar clips generados por IA, metraje de archivo o procesar renders en resultados más limpios y cinematográficos.
Diseñado para artistas y editores, el flujo de trabajo SeedVR2 V2.5 maneja tanto imágenes individuales como videos completos, incluyendo contenido RGBA, y preserva el audio original y la tasa de fotogramas al reensamblar el video escalado. Incluye aceleración opcional en tiempo de compilación y opciones de modelo que equilibran calidad, VRAM y velocidad.
Modelos clave en el flujo de trabajo ComfyUI SeedVR2 V2.5
- SeedVR2 Diffusion Transformer 3B y 7B. Modelos de restauración de un solo paso que mejoran la resolución y la calidad perceptual al tiempo que mantienen la coherencia temporal. Use 3B para menor VRAM o tiempos de respuesta más rápidos y 7B cuando desee la mayor fidelidad. Vea las tarjetas de modelo oficiales y el documento para más detalles: ByteDance-Seed/SeedVR2-3B, ByteDance-Seed/SeedVR2-7B, y el documento de SeedVR2 sobre restauración de video de un solo paso arXiv:2506.05301.
- SeedVR2 VAE (ema_vae_fp16). Codificador-Descodificador Variacional utilizado para codificar fotogramas al espacio latente y decodificar los resultados restaurados de nuevo a RGB con soporte de mosaico para grandes resoluciones. Distribuido con la integración ComfyUI: numz/SeedVR2_comfyUI.
- Variantes cuantificadas opcionales. La integración comunitaria expone opciones FP8 y GGUF para reducir la memoria con algún compromiso de calidad o velocidad. Vea el repositorio de nodos ComfyUI SeedVR2 para las opciones actuales: ComfyUI-SeedVR2_VideoUpscaler.
Cómo usar el flujo de trabajo ComfyUI SeedVR2 V2.5
Este gráfico tiene dos grupos independientes que comparten los mismos cargadores de modelo y lógica de escalado. Use el grupo de Imagen para imágenes fijas individuales. Use el grupo de Video para dividir un video en fotogramas y audio, escalar los fotogramas con SeedVR2 V2.5, luego reensamblar el clip con el audio y fps originales.
Grupo de Imagen
Cargue una imagen fija con LoadImage (#27). Si su imagen tiene transparencia, enrútela a través de JoinImageWithAlpha (#31) para que el canal alfa se preserve durante el escalado. Elija y cargue un punto de control DiT con SeedVR2LoadDiTModel (#28) y un VAE con SeedVR2LoadVAEModel (#29); los modelos se descargan automáticamente en el primer uso. Alimente la imagen en SeedVR2VideoUpscaler (#30) para escalar y restaurar; el nodo se centra en la recuperación de detalles y el afilado controlado que coincide con el aspecto de SeedVR2 V2.5. Guarde los resultados con SaveImage (#32). Para ejecuciones por lotes, puede habilitar SeedVR2TorchCompileSettings (#25) para compilar el gráfico una vez y acelerar los lotes subsecuentes.
Grupo de Video
Importe un clip con LoadVideo (#21), luego GetVideoComponents (#22) extrae fotogramas, audio y fps. Si sus fotogramas contienen alfa, únalo a través de JoinImageWithAlpha (#17) antes de escalar. Cargue su DiT y VAE elegidos con SeedVR2LoadDiTModel (#14) y SeedVR2LoadVAEModel (#13), luego escale el flujo de fotogramas con SeedVR2VideoUpscaler (#10). Reconstruya el video usando CreateVideo (#24), que pasa a través del audio y fps originales, y escriba el archivo con SaveVideo (#23). Para clips largos, SeedVR2TorchCompileSettings (#19) reduce el tiempo por iteración después de un paso de compilación inicial.
Nodos clave en el flujo de trabajo ComfyUI SeedVR2 V2.5
SeedVR2VideoUpscaler (#10 y #30) Nodo central de restauración y escalado potenciado por SeedVR2. Establezca su objetivo de escalado ya sea por escala o dimensiones objetivo, y elija un tamaño de lote que se ajuste a su GPU. La consistencia temporal se logra procesando múltiples fotogramas vecinos juntos; la guía oficial señala que un lote de al menos 5 fotogramas activa la consistencia temporal para videos, con lotes más grandes mejorando la estabilidad si el VRAM lo permite ComfyUI-SeedVR2_VideoUpscaler. Para RGBA, asegúrese de que el camino alfa esté conectado río arriba. Si ve presión de memoria a altas resoluciones, reduzca la resolución objetivo o cambie a una variante de modelo más ligera.
SeedVR2LoadDiTModel (#14 y #28) Carga el punto de control del transformador SeedVR2 y configura el dispositivo de inferencia. Elija entre 3B y 7B según su presupuesto de calidad y VRAM; FP16 ofrece la mejor fidelidad, mientras que FP8 o GGUF pueden ayudar en GPUs restringidas como expone la integración comunitaria numz/SeedVR2_comfyUI y el repositorio oficial de nodos ComfyUI ComfyUI-SeedVR2_VideoUpscaler. Mantenga el DiT en su GPU más rápida a menos que esté descargando explícitamente para memoria.
SeedVR2LoadVAEModel (#13 y #29) Carga el VAE EMA utilizado para codificar y decodificar. Al apuntar a grandes salidas, habilite la codificación o decodificación en mosaico para reducir el pico de VRAM a un pequeño costo en velocidad; ajuste el tamaño y la superposición de mosaico solo si encuentra OOM o artefactos de borde. Descargar el VAE a la CPU u otra GPU puede liberar espacio para el DiT sin cambiar los resultados numz/SeedVR2_comfyUI.
SeedVR2TorchCompileSettings (#19 y #25) Aceleración opcional que compila partes de la ruta SeedVR2 a un plan de kernel fusionado. La primera ejecución paga un costo de compilación, luego los lotes subsecuentes son más rápidos, lo cual es ideal para videos más largos o iteraciones repetidas ComfyUI-SeedVR2_VideoUpscaler.
Extras opcionales
- Elija el modelo que se ajuste a su trabajo: 3B para velocidad o VRAM limitada, 7B cuando importa el detalle absoluto SeedVR2-3B, SeedVR2-7B.
- Preserve audio y sincronización manteniendo las salidas
audioyfpsdeGetVideoComponents(#22) conectadas aCreateVideo(#24). - Para contenido pesado con transparencia, asegúrese de que el alfa esté fusionado a través de
JoinImageWithAlphaantes del escalador para mantener los bordes nítidos en la composición. - Si encuentra OOM, pruebe una resolución de salida más baja, cambie al modelo 3B, habilite el mosaico VAE o use un punto de control cuantificado donde esté disponible numz/SeedVR2_comfyUI.
- Para un trasfondo más profundo sobre cómo SeedVR2 logra restauración de un solo paso con atención de ventana adaptable y postentrenamiento adversarial, vea el documento arXiv:2506.05301 e implementación de referencia IceClear/SeedVR2.
Agradecimientos
Este flujo de trabajo implementa y se basa en los siguientes trabajos y recursos. Agradecemos a numz por el ComfyUI-SeedVR2_VideoUpscaler (nodos/flujo de trabajo SeedVR2 v2.5), y AInVFX por el tutorial de video oficial SeedVR2 v2.5, por sus contribuciones y mantenimiento. Para detalles autorizados, consulte la documentación original y los repositorios enlazados a continuación.
Recursos
- Fuente de SeedVR2 V2.5: https://www.reddit.com/r/comfyui/comments/1ordkfc/seedvr2_v25_released_complete_redesign_with_gguf
- GitHub: numz/ComfyUI-SeedVR2_VideoUpscaler
- Documentos / Notas de lanzamiento: Publicación en Reddit
- Demo de SeedVR2 V2.5 en Youtube: https://www.youtube.com/watch?v=MBtWYXq_r60
- Documentos / Notas de lanzamiento @AInVFX: Video en YouTube
Nota: El uso de los modelos, conjuntos de datos y código referenciados está sujeto a las respectivas licencias y términos proporcionados por sus autores y mantenedores.

