logo
RunComfy
  • ComfyUI
  • TrainerNew
  • Models
  • API
  • Pricing
discord logo
ComfyUI>Flujos de trabajo>Sonic | Animación de Retratos con Sincronización Labial

Sonic | Animación de Retratos con Sincronización Labial

Workflow Name: RunComfy/Sonic
Workflow ID: 0000...1191
Actualizado 16/06/2025: La versión de ComfyUI se actualizó a v0.3.39 para mejorar la estabilidad y compatibilidad. Sonic revoluciona la animación de retratos aprovechando la percepción global del audio para movimientos faciales más suaves y expresivos. Al capturar el contexto completo del audio, Sonic asegura animaciones realistas y emocionalmente resonantes que van más allá de los métodos basados en fonemas. Experimenta la próxima generación de animación de retratos con Sonic.

ComfyUI Sonic redefine la animación de retratos al aprovechar la percepción global del audio para movimientos faciales y expresiones ultrarrealistas. A diferencia de los métodos tradicionales, captura el contexto completo del discurso—más allá de los fonemas—para generar animaciones fluidas y emocionalmente ricas. Con tecnología avanzada de IA, Sonic asegura una sincronización perfecta entre la voz y las imágenes, dando vida a los personajes con un realismo inigualable. Eleva tus animaciones con Sonic y haz que cada expresión se sienta verdaderamente viva.

Los nodos de ComfyUI Sonic y el flujo de trabajo relacionado fueron desarrollados por smthemex. Para más información, por favor visita el GitHub de smthemex.

1.1 ¿Cómo Usar el Flujo de Trabajo de Sonic?

Sonic

Los nodos de la izquierda son tus entradas para Audio e Imagen de Avatar. El del medio es el Nodo de Procesamiento de Sonic. El lado derecho es el nodo de combinación de video para la salida de video.

Sigue estos Pasos:

  1. Ingresa tu Imagen de Avatar que se usará para visualizar los diálogos del audio.
  2. Ingresa tu Audio para generar una voz en off impulsada por audio de la imagen insertada.
  3. ¡Haz clic en Queue Prompt!!

¡Listo! Tu video renderizado se guardará en la carpeta Outputs.

Fortalezas y Debilidades de Sonic:

Fortalezas:

  • Sonic genera animaciones de retratos altamente realistas y expresivas impulsadas por audio.
  • Sonic usa SVD, por lo que no hay parpadeo entre fotogramas.
  • La consistencia es mejor que en los modelos de audio2video lanzados anteriormente.

Debilidades:

  • Como Sonic usa SVD, las tomas lejanas o de cuerpo completo pueden tener dificultades para proyectar correctamente las vocales en la cara.
  • Las caras de vista lateral, o las caras en ángulos complejos, pueden dar resultados distorsionados.

1.2 Entrada de Audio y Video de Sonic

Sonic
  • Sube tu Audio en el nodo de carga de audio (Diálogos o Voces)
  • Sube tu imagen en el nodo de carga de imagen (Un primer plano o toma media de una persona)

1.3 Nodo de Procesamiento de Sonic

Sonic

ComfyUI Sonic utiliza el Modelo SVD en segundo plano para el procesamiento, por lo que los resultados y configuraciones son según el modelo SVD. Estas configuraciones están optimizadas; no hay necesidad de cambiarlas.

  • Mantén min resolution cerca de 768 o menos si hay artefactos como deformaciones o manos distorsionadas.

Sonic transforma la animación de retratos al enfocarse en la percepción global del audio para expresiones fluidas y realistas. Al capturar toda la profundidad del discurso, crea animaciones que se sienten naturales, emotivas y atractivas. Ya sea para narración, avatares virtuales o creación de contenido, Sonic ofrece un realismo inigualable. Adéntrate en el futuro de la animación con Sonic—donde cada palabra cobra vida.

Want More ComfyUI Workflows?

FLUX IPAdapter V2 | XLabs

FLUX IPAdapter V2 | XLabs

Explore el modelo XLabs FLUX IPAdapter V2 en comparación con V1 para sus objetivos creativos.

Cámara de Acercamiento - Un Motion LoRA para Wan 2.1

Una imagen dentro, tomas de acercamiento de película afuera. Cero complejidad.

Wan 2.1 Control LoRA | Profundidad y Mosaico

Avanza la generación de video Wan 2.1 con LoRAs de profundidad y mosaico ligeros para mejorar la estructura y el detalle.

Qwen-Image | Generador de Posters Multi-Texto en HD

Qwen-Image | Generador de Posters Multi-Texto en HD

¡Nueva Era de Generación de Texto en Imágenes!

Wan2.2 S2V | Generador de Sonido a Video

Convierte tu clip de audio en un video realista y sincronizado desde una imagen

Nunchaku Qwen Image | Editor de Imágenes Múltiples

Mezcla y estiliza múltiples imágenes con control de siguiente nivel.

IPAdapter Plus (V2) | Cambiar ropa

IPAdapter Plus (V2) | Cambiar ropa

Use IPAdapter Plus para la creación de sus modelos de moda, cambiando fácilmente de atuendos y estilos

Hallo2 | Animación de Retrato de Sincronización Labial

Sincronización labial impulsada por audio para animación de retratos en 4K.

Síguenos
  • LinkedIn
  • Facebook
  • Instagram
  • Twitter
Soporte
  • Discord
  • Correo electrónico
  • Estado del sistema
  • afiliado
Recursos
  • ComfyUI en línea gratis
  • Guías de ComfyUI
  • RunComfy API
  • Tutoriales de ComfyUI
  • Nodos de ComfyUI
  • Aprende más
Legal
  • Términos de servicio
  • Política de privacidad
  • Política de cookies
RunComfy
Derechos de autor 2026 RunComfy. Todos los derechos reservados.

RunComfy es la principal ComfyUI plataforma, ofreciendo ComfyUI en línea entorno y servicios, junto con flujos de trabajo de ComfyUI con impresionantes imágenes. RunComfy también ofrece AI Models, permitiendo a los artistas aprovechar las últimas herramientas de AI para crear arte increíble.