ComfyUI>Workflows>Sonic | Lip-Sync Portrait-Animation

Sonic | Lip-Sync Portrait-Animation

Workflow Name: RunComfy/Sonic

Workflow ID: 0000...1191

Aktualisiert am 16.06.2025: ComfyUI-Version auf v0.3.39 aktualisiert für verbesserte Stabilität und Kompatibilität. Sonic revolutioniert die Portrait-Animation, indem es die globale Audiowahrnehmung nutzt, um flüssigere, ausdrucksstärkere Gesichtsausdrücke zu erzeugen. Durch die Erfassung des gesamten Audiokontexts sorgt Sonic für lebensechte, emotional resonante Animationen, die über phonembasierte Methoden hinausgehen. Erleben Sie die nächste Generation der Portrait-Animation mit Sonic.

ComfyUI Sonic definiert die Portrait-Animation neu, indem es die globale Audiowahrnehmung nutzt, um ultrarealistische Gesichtsausdrücke und Bewegungen zu erzeugen. Im Gegensatz zu traditionellen Methoden erfasst es den vollständigen Kontext der Sprache—über Phoneme hinaus—um flüssige, emotional reiche Animationen zu erzeugen. Mit modernster KI-Technologie sorgt Sonic für nahtlose Synchronisation zwischen Stimme und Visuals, sodass Charaktere mit unvergleichlichem Realismus zum Leben erweckt werden. Heben Sie Ihre Animationen mit Sonic auf ein neues Niveau und lassen Sie jeden Ausdruck wirklich lebendig wirken.

Die ComfyUI Sonic-Nodes und der zugehörige Workflow wurden von smthemex entwickelt. Für weitere Informationen besuchen Sie bitte smthemex's GitHub.

1.1 Wie verwendet man den Sonic-Workflow?

Sonic

Die linken Nodes sind Ihre Eingaben für Audio und Avatar-Bild. Der mittlere ist der Sonic Processing Node. Auf der rechten Seite ist der Videokombinations-Node für die Ausgabe des Videos.

Folgen Sie diesen Schritten:

Geben Sie Ihr Avatar-Bild ein, das zur Visualisierung der Dialoge aus dem Audio verwendet wird.
Geben Sie Ihr Audio ein, um ein audiogesteuertes Voice-Over des eingefügten Bildes zu erzeugen.
Klicken Sie auf Queue Prompt!!

Fertig! Ihr gerendertes Video wird im Outputs-Ordner gespeichert.

Stärken und Schwächen von Sonic:

Stärken:

Sonic erzeugt hochrealistische und ausdrucksstarke Portrait-Animationen, die durch Audio gesteuert werden.
Sonic verwendet SVD, sodass es kein Flackern zwischen den Frames gibt.
Die Konsistenz ist besser als bei zuvor veröffentlichten audio2video-Modellen.

Schwächen:

Da Sonic SVD verwendet, können weite oder Ganzkörperaufnahmen Schwierigkeiten haben, die Stimme richtig auf das Gesicht zu projizieren.
Seitenansichten von Gesichtern oder Gesichter in komplexen Winkeln können verzerrte Ergebnisse liefern.

1.2 Sonic Audio- und Videoeingabe

Sonic

Laden Sie Ihr Audio im Lade-Audio-Node hoch (Dialoge oder Gesang)
Laden Sie Ihr Bild im Lade-Bild-Node hoch (Eine Nahaufnahme oder eine mittlere Aufnahme einer Person)

1.3 Sonic Processing Node

Sonic

ComfyUI Sonic verwendet das SVD-Modell im Hintergrund für die Verarbeitung, daher sind die Ergebnisse und Einstellungen entsprechend dem SVD-Modell. Diese Einstellungen sind auf optimal eingestellt; es ist nicht notwendig, sie zu ändern.

Halten Sie die min resolution bei 768 oder darunter, wenn Artefakte wie Verformungen oder verzerrte Hände auftreten.

Sonic transformiert die Portrait-Animation, indem es sich auf die globale Audiowahrnehmung konzentriert, um nahtlose, lebendige Ausdrücke zu schaffen. Durch die Erfassung der gesamten Tiefe der Sprache erzeugt es Animationen, die natürlich, emotional und fesselnd wirken. Ob für Geschichtenerzählen, virtuelle Avatare oder Content-Erstellung, Sonic liefert unvergleichlichen Realismus. Treten Sie ein in die Zukunft der Animation mit Sonic—wo jedes Wort zum Leben erwacht.

Want More ComfyUI Workflows?

LayerDiffuse + TripoSR | Bild zu 3D

Verwenden Sie LayerDiffuse für Bildtransparenz und TripoSR für die schnelle Erstellung von 3D-Objekten

FLUX LoRA Training

Führen Sie durch den gesamten Prozess des Trainings von FLUX LoRA-Modellen mit Ihren eigenen Datensätzen.

AnimateDiff + QR Code ControlNet | Visuelle Effekte (VFX)

Erstellen Sie fesselnde visuelle Effekte mit AnimateDiff und ControlNet (mit QRCode Monster und Lineart).

FLUX ControlNet Depth-V3 & Canny-V3

Erreichen Sie bessere Kontrolle mit FLUX-ControlNet-Depth & FLUX-ControlNet-Canny für FLUX.1 [dev].

IPAdapter Plus (V2) | Stil und Komposition

IPAdapter Plus ermöglicht effektive Stil- und Kompositionsübertragung und funktioniert wie ein 1-Bild-LoRA.

FLUX Kontext Face Swap | Nahtloser Gesichtsersatz

Fotorealistischer Gesichtsersatz mit prompt-gesteuerter Kontrolle und natürlichem Übergang

CCSR | Konsistenter Bild-/Video-Upscaler

Das CCSR-Modell verbessert das Upscaling von Bildern und Videos durch stärkere Fokussierung auf Inhaltsbeständigkeit.

Flux Fill | Inpaint und Outpaint

Offizielle Flux Tools - Flux Fill für Inpainting und Outpainting

Support

Ressourcen

Rechtliches

RunComfy

RunComfy ist die führende ComfyUI Plattform, die ComfyUI online Umgebung und Services bietet, zusammen mit ComfyUI Workflows mit atemberaubenden Visualisierungen. RunComfy bietet auch AI-Spielplatz, Künstlern ermöglichen, die neuesten AI-Tools zu nutzen, um unglaubliche Kunst zu schaffen.