logo
RunComfy
ComfyUIPlaygroundPricing
discord logo
ComfyUI>Workflows>Sonic | Lip-Sync Portrait-Animation

Sonic | Lip-Sync Portrait-Animation

Workflow Name: RunComfy/Sonic
Workflow ID: 0000...1191
Aktualisiert am 16.06.2025: ComfyUI-Version auf v0.3.39 aktualisiert für verbesserte Stabilität und Kompatibilität. Sonic revolutioniert die Portrait-Animation, indem es die globale Audiowahrnehmung nutzt, um flüssigere, ausdrucksstärkere Gesichtsausdrücke zu erzeugen. Durch die Erfassung des gesamten Audiokontexts sorgt Sonic für lebensechte, emotional resonante Animationen, die über phonembasierte Methoden hinausgehen. Erleben Sie die nächste Generation der Portrait-Animation mit Sonic.

ComfyUI Sonic definiert die Portrait-Animation neu, indem es die globale Audiowahrnehmung nutzt, um ultrarealistische Gesichtsausdrücke und Bewegungen zu erzeugen. Im Gegensatz zu traditionellen Methoden erfasst es den vollständigen Kontext der Sprache—über Phoneme hinaus—um flüssige, emotional reiche Animationen zu erzeugen. Mit modernster KI-Technologie sorgt Sonic für nahtlose Synchronisation zwischen Stimme und Visuals, sodass Charaktere mit unvergleichlichem Realismus zum Leben erweckt werden. Heben Sie Ihre Animationen mit Sonic auf ein neues Niveau und lassen Sie jeden Ausdruck wirklich lebendig wirken.

Die ComfyUI Sonic-Nodes und der zugehörige Workflow wurden von smthemex entwickelt. Für weitere Informationen besuchen Sie bitte smthemex's GitHub.

1.1 Wie verwendet man den Sonic-Workflow?

Sonic

Die linken Nodes sind Ihre Eingaben für Audio und Avatar-Bild. Der mittlere ist der Sonic Processing Node. Auf der rechten Seite ist der Videokombinations-Node für die Ausgabe des Videos.

Folgen Sie diesen Schritten:

  1. Geben Sie Ihr Avatar-Bild ein, das zur Visualisierung der Dialoge aus dem Audio verwendet wird.
  2. Geben Sie Ihr Audio ein, um ein audiogesteuertes Voice-Over des eingefügten Bildes zu erzeugen.
  3. Klicken Sie auf Queue Prompt!!

Fertig! Ihr gerendertes Video wird im Outputs-Ordner gespeichert.

Stärken und Schwächen von Sonic:

Stärken:

  • Sonic erzeugt hochrealistische und ausdrucksstarke Portrait-Animationen, die durch Audio gesteuert werden.
  • Sonic verwendet SVD, sodass es kein Flackern zwischen den Frames gibt.
  • Die Konsistenz ist besser als bei zuvor veröffentlichten audio2video-Modellen.

Schwächen:

  • Da Sonic SVD verwendet, können weite oder Ganzkörperaufnahmen Schwierigkeiten haben, die Stimme richtig auf das Gesicht zu projizieren.
  • Seitenansichten von Gesichtern oder Gesichter in komplexen Winkeln können verzerrte Ergebnisse liefern.

1.2 Sonic Audio- und Videoeingabe

Sonic

  • Laden Sie Ihr Audio im Lade-Audio-Node hoch (Dialoge oder Gesang)
  • Laden Sie Ihr Bild im Lade-Bild-Node hoch (Eine Nahaufnahme oder eine mittlere Aufnahme einer Person)

1.3 Sonic Processing Node

Sonic

ComfyUI Sonic verwendet das SVD-Modell im Hintergrund für die Verarbeitung, daher sind die Ergebnisse und Einstellungen entsprechend dem SVD-Modell. Diese Einstellungen sind auf optimal eingestellt; es ist nicht notwendig, sie zu ändern.

  • Halten Sie die min resolution bei 768 oder darunter, wenn Artefakte wie Verformungen oder verzerrte Hände auftreten.

Sonic transformiert die Portrait-Animation, indem es sich auf die globale Audiowahrnehmung konzentriert, um nahtlose, lebendige Ausdrücke zu schaffen. Durch die Erfassung der gesamten Tiefe der Sprache erzeugt es Animationen, die natürlich, emotional und fesselnd wirken. Ob für Geschichtenerzählen, virtuelle Avatare oder Content-Erstellung, Sonic liefert unvergleichlichen Realismus. Treten Sie ein in die Zukunft der Animation mit Sonic—wo jedes Wort zum Leben erwacht.

Want More ComfyUI Workflows?

ComfyUI FLUX | Eine neue Kunstbild-Generierung

ComfyUI FLUX | Eine neue Kunstbild-Generierung

Ein neues Bildgenerierungsmodell, entwickelt von Black Forest Labs

SUPIR | Fotorealistischer Bild-/Video-Upscaler

SUPIR ermöglicht fotorealistische Bildwiederherstellung, funktioniert mit dem SDXL-Modell und unterstützt textgesteuerte Verbesserungen.

Virtuelle Anprobe | Realistische Modeanpassung

Sofortige Outfit-Vorschauen mit natürlichen, gut sitzenden Bekleidungsvisualisierungen

Segment Anything V2 (SAM2) | Video-Segmentierung

Objekterkennung in Videos mit unübertroffener Genauigkeit.

Wan FusionX | T2V+I2V+VACE Komplett

Die bisher leistungsstärkste Videogenerierungslösung! Kinoqualität im Detail, Ihr persönliches Filmstudio.

Step1X-Edit | KI-Bildbearbeitungstool

Führen Sie 11 Bearbeitungsvorgänge mit natürlicher Sprache in Step1X-Edit durch.

SVD (Stable Video Diffusion) + SD | Text zu Video

Integrieren Sie Stable Diffusion und Stable Video Diffusion, um Text direkt in ein Video umzuwandeln.

Uni3C Video-Referenced Kamera- & Bewegungstransfer

Extrahieren Sie Kamerabewegungen und menschliche Bewegungen aus Referenzvideos für professionelle Videogenerierung

Folge uns
  • LinkedIn
  • Facebook
  • Instagram
  • Twitter
Support
  • Discord
  • E-Mail
  • Systemstatus
  • Partner
Ressourcen
  • Kostenloses ComfyUI Online
  • ComfyUI Anleitungen
  • RunComfy API
  • ComfyUI Tutorials
  • ComfyUI Nodes
  • Erfahre mehr
Rechtliches
  • Nutzungsbedingungen
  • Datenschutzrichtlinie
  • Cookie-Richtlinie
RunComfy
Urheberrecht 2025 RunComfy. Alle Rechte vorbehalten.

RunComfy ist die führende ComfyUI Plattform, die ComfyUI online Umgebung und Services bietet, zusammen mit ComfyUI Workflows mit atemberaubenden Visualisierungen. RunComfy bietet auch AI-Spielplatz, Künstlern ermöglichen, die neuesten AI-Tools zu nutzen, um unglaubliche Kunst zu schaffen.