logo
RunComfy
  • ComfyUI
  • TrainerNeu
  • Modelle
  • API
  • Preise
discord logo
ComfyUI>Workflows>Sonic | Lip-Sync Portrait-Animation

Sonic | Lip-Sync Portrait-Animation

Workflow Name: RunComfy/Sonic
Workflow ID: 0000...1191
Aktualisiert am 16.06.2025: ComfyUI-Version auf v0.3.39 aktualisiert für verbesserte Stabilität und Kompatibilität. Sonic revolutioniert die Portrait-Animation, indem es die globale Audiowahrnehmung nutzt, um flüssigere, ausdrucksstärkere Gesichtsausdrücke zu erzeugen. Durch die Erfassung des gesamten Audiokontexts sorgt Sonic für lebensechte, emotional resonante Animationen, die über phonembasierte Methoden hinausgehen. Erleben Sie die nächste Generation der Portrait-Animation mit Sonic.

ComfyUI Sonic definiert die Portrait-Animation neu, indem es die globale Audiowahrnehmung nutzt, um ultrarealistische Gesichtsausdrücke und Bewegungen zu erzeugen. Im Gegensatz zu traditionellen Methoden erfasst es den vollständigen Kontext der Sprache—über Phoneme hinaus—um flüssige, emotional reiche Animationen zu erzeugen. Mit modernster KI-Technologie sorgt Sonic für nahtlose Synchronisation zwischen Stimme und Visuals, sodass Charaktere mit unvergleichlichem Realismus zum Leben erweckt werden. Heben Sie Ihre Animationen mit Sonic auf ein neues Niveau und lassen Sie jeden Ausdruck wirklich lebendig wirken.

Die ComfyUI Sonic-Nodes und der zugehörige Workflow wurden von smthemex entwickelt. Für weitere Informationen besuchen Sie bitte smthemex's GitHub.

1.1 Wie verwendet man den Sonic-Workflow?

Sonic

Die linken Nodes sind Ihre Eingaben für Audio und Avatar-Bild. Der mittlere ist der Sonic Processing Node. Auf der rechten Seite ist der Videokombinations-Node für die Ausgabe des Videos.

Folgen Sie diesen Schritten:

  1. Geben Sie Ihr Avatar-Bild ein, das zur Visualisierung der Dialoge aus dem Audio verwendet wird.
  2. Geben Sie Ihr Audio ein, um ein audiogesteuertes Voice-Over des eingefügten Bildes zu erzeugen.
  3. Klicken Sie auf Queue Prompt!!

Fertig! Ihr gerendertes Video wird im Outputs-Ordner gespeichert.

Stärken und Schwächen von Sonic:

Stärken:

  • Sonic erzeugt hochrealistische und ausdrucksstarke Portrait-Animationen, die durch Audio gesteuert werden.
  • Sonic verwendet SVD, sodass es kein Flackern zwischen den Frames gibt.
  • Die Konsistenz ist besser als bei zuvor veröffentlichten audio2video-Modellen.

Schwächen:

  • Da Sonic SVD verwendet, können weite oder Ganzkörperaufnahmen Schwierigkeiten haben, die Stimme richtig auf das Gesicht zu projizieren.
  • Seitenansichten von Gesichtern oder Gesichter in komplexen Winkeln können verzerrte Ergebnisse liefern.

1.2 Sonic Audio- und Videoeingabe

Sonic
  • Laden Sie Ihr Audio im Lade-Audio-Node hoch (Dialoge oder Gesang)
  • Laden Sie Ihr Bild im Lade-Bild-Node hoch (Eine Nahaufnahme oder eine mittlere Aufnahme einer Person)

1.3 Sonic Processing Node

Sonic

ComfyUI Sonic verwendet das SVD-Modell im Hintergrund für die Verarbeitung, daher sind die Ergebnisse und Einstellungen entsprechend dem SVD-Modell. Diese Einstellungen sind auf optimal eingestellt; es ist nicht notwendig, sie zu ändern.

  • Halten Sie die min resolution bei 768 oder darunter, wenn Artefakte wie Verformungen oder verzerrte Hände auftreten.

Sonic transformiert die Portrait-Animation, indem es sich auf die globale Audiowahrnehmung konzentriert, um nahtlose, lebendige Ausdrücke zu schaffen. Durch die Erfassung der gesamten Tiefe der Sprache erzeugt es Animationen, die natürlich, emotional und fesselnd wirken. Ob für Geschichtenerzählen, virtuelle Avatare oder Content-Erstellung, Sonic liefert unvergleichlichen Realismus. Treten Sie ein in die Zukunft der Animation mit Sonic—wo jedes Wort zum Leben erwacht.

Want More ComfyUI Workflows?

AnimateDiff + ControlNet | Marmorskulpturenstil

Verwandeln Sie Ihre Videos in zeitlose Marmorskulpturen und fangen Sie die Essenz klassischer Kunst ein.

Multitalk | Realistischer Sprechender Video-Maker

Mit einem Klick mehrsprecher-lippen-synchronisierte Videos aus Porträts und Stimmen erstellen!

Animatediff V2 & V3 | Text zu Video

Erkunden Sie AnimateDiff V3, AnimateDiff SDXL und AnimateDiff V2 und verwenden Sie Upscale für hochauflösende Ergebnisse.

Wan 2.1 Fun | I2V + T2V

Stärken Sie Ihre KI-Videos mit Wan 2.1 Fun.

SeedVR2 V2.5 | KI-Video-Upscaling-Workflow

Videos schnell hochskalieren mit scharfen, geschmeidigen, filmischen Ergebnissen.

HiDream E1.1 | AI Bildbearbeitung

Bilder mit natürlicher Sprache mit dem HiDream E1.1-Modell bearbeiten

LTX-2 ComfyUI | Echtzeit-Video-Generator

Erstellen Sie Echtzeit-Videos sofort, schneller als jeder andere Generator.

Stable Diffusion 3.5

Stable Diffusion 3.5

Stable Diffusion 3.5 (SD3.5) für hochwertige, vielfältige Bilderzeugung.

Folge uns
  • LinkedIn
  • Facebook
  • Instagram
  • Twitter
Support
  • Discord
  • E-Mail
  • Systemstatus
  • Partner
Ressourcen
  • Kostenloses ComfyUI Online
  • ComfyUI Anleitungen
  • RunComfy API
  • ComfyUI Tutorials
  • ComfyUI Nodes
  • Erfahre mehr
Rechtliches
  • Nutzungsbedingungen
  • Datenschutzrichtlinie
  • Cookie-Richtlinie
RunComfy
Urheberrecht 2026 RunComfy. Alle Rechte vorbehalten.

RunComfy ist die führende ComfyUI Plattform, die ComfyUI online Umgebung und Services bietet, zusammen mit ComfyUI Workflows mit atemberaubenden Visualisierungen. RunComfy bietet auch AI Models, Künstlern ermöglichen, die neuesten AI-Tools zu nutzen, um unglaubliche Kunst zu schaffen.