logo
RunComfy
  • ComfyUI
  • TrainerNew
  • Models
  • API
  • Pricing
discord logo
ComfyUI>Workflows>Sonic | Lip-Sync Portrait-Animation

Sonic | Lip-Sync Portrait-Animation

Workflow Name: RunComfy/Sonic
Workflow ID: 0000...1191
Aktualisiert am 16.06.2025: ComfyUI-Version auf v0.3.39 aktualisiert für verbesserte Stabilität und Kompatibilität. Sonic revolutioniert die Portrait-Animation, indem es die globale Audiowahrnehmung nutzt, um flüssigere, ausdrucksstärkere Gesichtsausdrücke zu erzeugen. Durch die Erfassung des gesamten Audiokontexts sorgt Sonic für lebensechte, emotional resonante Animationen, die über phonembasierte Methoden hinausgehen. Erleben Sie die nächste Generation der Portrait-Animation mit Sonic.

ComfyUI Sonic definiert die Portrait-Animation neu, indem es die globale Audiowahrnehmung nutzt, um ultrarealistische Gesichtsausdrücke und Bewegungen zu erzeugen. Im Gegensatz zu traditionellen Methoden erfasst es den vollständigen Kontext der Sprache—über Phoneme hinaus—um flüssige, emotional reiche Animationen zu erzeugen. Mit modernster KI-Technologie sorgt Sonic für nahtlose Synchronisation zwischen Stimme und Visuals, sodass Charaktere mit unvergleichlichem Realismus zum Leben erweckt werden. Heben Sie Ihre Animationen mit Sonic auf ein neues Niveau und lassen Sie jeden Ausdruck wirklich lebendig wirken.

Die ComfyUI Sonic-Nodes und der zugehörige Workflow wurden von smthemex entwickelt. Für weitere Informationen besuchen Sie bitte smthemex's GitHub.

1.1 Wie verwendet man den Sonic-Workflow?

Sonic

Die linken Nodes sind Ihre Eingaben für Audio und Avatar-Bild. Der mittlere ist der Sonic Processing Node. Auf der rechten Seite ist der Videokombinations-Node für die Ausgabe des Videos.

Folgen Sie diesen Schritten:

  1. Geben Sie Ihr Avatar-Bild ein, das zur Visualisierung der Dialoge aus dem Audio verwendet wird.
  2. Geben Sie Ihr Audio ein, um ein audiogesteuertes Voice-Over des eingefügten Bildes zu erzeugen.
  3. Klicken Sie auf Queue Prompt!!

Fertig! Ihr gerendertes Video wird im Outputs-Ordner gespeichert.

Stärken und Schwächen von Sonic:

Stärken:

  • Sonic erzeugt hochrealistische und ausdrucksstarke Portrait-Animationen, die durch Audio gesteuert werden.
  • Sonic verwendet SVD, sodass es kein Flackern zwischen den Frames gibt.
  • Die Konsistenz ist besser als bei zuvor veröffentlichten audio2video-Modellen.

Schwächen:

  • Da Sonic SVD verwendet, können weite oder Ganzkörperaufnahmen Schwierigkeiten haben, die Stimme richtig auf das Gesicht zu projizieren.
  • Seitenansichten von Gesichtern oder Gesichter in komplexen Winkeln können verzerrte Ergebnisse liefern.

1.2 Sonic Audio- und Videoeingabe

Sonic
  • Laden Sie Ihr Audio im Lade-Audio-Node hoch (Dialoge oder Gesang)
  • Laden Sie Ihr Bild im Lade-Bild-Node hoch (Eine Nahaufnahme oder eine mittlere Aufnahme einer Person)

1.3 Sonic Processing Node

Sonic

ComfyUI Sonic verwendet das SVD-Modell im Hintergrund für die Verarbeitung, daher sind die Ergebnisse und Einstellungen entsprechend dem SVD-Modell. Diese Einstellungen sind auf optimal eingestellt; es ist nicht notwendig, sie zu ändern.

  • Halten Sie die min resolution bei 768 oder darunter, wenn Artefakte wie Verformungen oder verzerrte Hände auftreten.

Sonic transformiert die Portrait-Animation, indem es sich auf die globale Audiowahrnehmung konzentriert, um nahtlose, lebendige Ausdrücke zu schaffen. Durch die Erfassung der gesamten Tiefe der Sprache erzeugt es Animationen, die natürlich, emotional und fesselnd wirken. Ob für Geschichtenerzählen, virtuelle Avatare oder Content-Erstellung, Sonic liefert unvergleichlichen Realismus. Treten Sie ein in die Zukunft der Animation mit Sonic—wo jedes Wort zum Leben erwacht.

Want More ComfyUI Workflows?

FireRed Bildbearbeitung | Intelligenter Foto-Verbesserer

Scharfe Fotokorrekturen mit treuem Ton und perfekter Detailkontrolle.

LTX-2 Erste Letzte Frame | Schlüsselbilder Video-Generator

Verwandeln Sie Standbilder schnell in nahtlose Video- und Tonübergänge.

IPAdapter Plus (V2) Aufmerksamkeitsmaske | Bild zu Video

Nutzen Sie die IPAdapter Plus Aufmerksamkeitsmaske für eine präzise Kontrolle des Bildgenerierungsprozesses.

Face Restore + ControlNet + Reactor | Alte Fotos restaurieren

Face Restore + ControlNet + Reactor | Alte Fotos restaurieren

Lassen Sie verblasste Fotos zu lebendigen Erinnerungen wiederaufleben und bewahren Sie jedes Detail für eine wertvolle Erinnerung.

Qwen-Image | HD Multi-Text Poster Generator

Qwen-Image | HD Multi-Text Poster Generator

Neue Ära der Textgenerierung in Bildern!

IC-Light | Video-Beleuchtung | AnimateDiff

Beleuchten Sie Ihre Videos neu mit Lichtkarten und Prompts

AnimateDiff + ControlNet + IPAdapter V1 | Adventure-Game-Stil

Revolutionieren Sie Videos im Stil von Adventure-Games und erwecken Sie den Nervenkitzel des Spielens zum Leben!

PuLID | Präzises Gesichts-Embedding für Text-zu-Bild

PuLID | Präzises Gesichts-Embedding für Text-zu-Bild

Integrieren Sie Gesichtsidentitäten nahtlos und kontrollieren Sie Stile mit PuLID und IPAdapter Plus.

Folge uns
  • LinkedIn
  • Facebook
  • Instagram
  • Twitter
Support
  • Discord
  • E-Mail
  • Systemstatus
  • Partner
Ressourcen
  • Kostenloses ComfyUI Online
  • ComfyUI Anleitungen
  • RunComfy API
  • ComfyUI Tutorials
  • ComfyUI Nodes
  • Erfahre mehr
Rechtliches
  • Nutzungsbedingungen
  • Datenschutzrichtlinie
  • Cookie-Richtlinie
RunComfy
Urheberrecht 2026 RunComfy. Alle Rechte vorbehalten.

RunComfy ist die führende ComfyUI Plattform, die ComfyUI online Umgebung und Services bietet, zusammen mit ComfyUI Workflows mit atemberaubenden Visualisierungen. RunComfy bietet auch AI Models, Künstlern ermöglichen, die neuesten AI-Tools zu nutzen, um unglaubliche Kunst zu schaffen.