Sonic | Marco Avanzado de Animación de Retratos con Sincronización Labial

Los nodos de Sonic y su flujo de trabajo asociado son desarrollados completamente por smthemex. Damos todo el crédito debido a smthemex por este trabajo innovador. En la plataforma RunComfy, simplemente estamos presentando las contribuciones de smthemex a la comunidad. Es importante señalar que actualmente no existe ninguna conexión formal o asociación entre RunComfy y smthemex. ¡Apreciamos profundamente el trabajo de smthemex!

ComfyUI Sonic Flujo de trabajo

Sonic | Advanced Lip-Sync Portrait Animation Framework

¿Quiere ejecutar este flujo de trabajo?

Flujos de trabajo completamente operativos
Sin nodos ni modelos faltantes
No se requiere configuración manual
Presenta visuales impresionantes

ComfyUI Sonic Ejemplos

ComfyUI Sonic redefine la animación de retratos al aprovechar la percepción global del audio para movimientos faciales y expresiones ultrarrealistas. A diferencia de los métodos tradicionales, captura el contexto completo del discurso—más allá de los fonemas—para generar animaciones fluidas y emocionalmente ricas. Con tecnología avanzada de IA, Sonic asegura una sincronización perfecta entre la voz y las imágenes, dando vida a los personajes con un realismo inigualable. Eleva tus animaciones con Sonic y haz que cada expresión se sienta verdaderamente viva.

Los nodos de ComfyUI Sonic y el flujo de trabajo relacionado fueron desarrollados por smthemex. Para más información, por favor visita el GitHub de smthemex.

1.1 ¿Cómo Usar el Flujo de Trabajo de Sonic?#

Los nodos de la izquierda son tus entradas para Audio e Imagen de Avatar. El del medio es el Nodo de Procesamiento de Sonic. El lado derecho es el nodo de combinación de video para la salida de video.

Sigue estos Pasos:

Ingresa tu Imagen de Avatar que se usará para visualizar los diálogos del audio.
Ingresa tu Audio para generar una voz en off impulsada por audio de la imagen insertada.
¡Haz clic en Queue Prompt!!

¡Listo! Tu video renderizado se guardará en la carpeta Outputs.

Fortalezas y Debilidades de Sonic:#

Fortalezas:

Sonic genera animaciones de retratos altamente realistas y expresivas impulsadas por audio.
Sonic usa SVD, por lo que no hay parpadeo entre fotogramas.
La consistencia es mejor que en los modelos de audio2video lanzados anteriormente.

Debilidades:

Como Sonic usa SVD, las tomas lejanas o de cuerpo completo pueden tener dificultades para proyectar correctamente las vocales en la cara.
Las caras de vista lateral, o las caras en ángulos complejos, pueden dar resultados distorsionados.

1.2 Entrada de Audio y Video de Sonic#

Sube tu Audio en el nodo de carga de audio (Diálogos o Voces)
Sube tu imagen en el nodo de carga de imagen (Un primer plano o toma media de una persona)

1.3 Nodo de Procesamiento de Sonic#

ComfyUI Sonic utiliza el Modelo SVD en segundo plano para el procesamiento, por lo que los resultados y configuraciones son según el modelo SVD. Estas configuraciones están optimizadas; no hay necesidad de cambiarlas.

Mantén min resolution cerca de 768 o menos si hay artefactos como deformaciones o manos distorsionadas.

Sonic transforma la animación de retratos al enfocarse en la percepción global del audio para expresiones fluidas y realistas. Al capturar toda la profundidad del discurso, crea animaciones que se sienten naturales, emotivas y atractivas. Ya sea para narración, avatares virtuales o creación de contenido, Sonic ofrece un realismo inigualable. Adéntrate en el futuro de la animación con Sonic—donde cada palabra cobra vida.

Want More ComfyUI Workflows?

FLUX Outpainting

Usa SDXL y FLUX para expandir y refinar imágenes sin problemas.

Colección de Modelos Ajustados Z-Image | Generador Multiestilo

Crea imágenes impresionantes y detalladas en múltiples estilos y estados de ánimo fácilmente.

Wan2.2 Transferencia de Acción Animada V7 | Creador de Videos de Movimiento AI

Hace que tus personajes se muevan exactamente como personas reales—rápido y controlado.

Inferencia de Qwen Image 2512 LoRA | AI Toolkit ComfyUI

Utiliza un LoRA entrenado con AI Toolkit con Qwen Image 2512 en ComfyUI a través de un nodo RCQwenImage2512 para generaciones alineadas con la vista previa.

Character AI Ovi | Generador de Avatares Parlantes

Convierte cualquier foto en avatares parlantes realistas con emoción y voz.

Entrenamiento FLUX LoRA

Guía para todo el proceso de entrenamiento de modelos FLUX LoRA usando tus conjuntos de datos personalizados.

Wan2.2 Animate | Foto a Video de Movimiento Realista

Convierte imágenes en personajes realistas en movimiento con movimiento natural del cuerpo y la cara.

LTX-2 ControlNet | Generador de Video de Precisión

Control agudo, sincronización perfecta, creación de video AI super clara.

Soporte

Recursos

Legal

RunComfy

RunComfy es la principal ComfyUI plataforma, ofreciendo ComfyUI en línea entorno y servicios, junto con flujos de trabajo de ComfyUI con impresionantes imágenes. RunComfy también ofrece AI Models, permitiendo a los artistas aprovechar las últimas herramientas de AI para crear arte increíble.

Sonic | Animación de Retratos con Sincronización Labial