Erstelle filmische Clips mit Audio, nahtlosen Szenen und präziser Steuerung


Diese Vorlage auf RunComfy verwendet Alibabas asynchrone Videosynthese-API mit dem Modell „happyhorse-1.0-r2v“. Sie laden 1 bis 9 Referenzbilder hoch, bezeichnen jedes in der Eingabeaufforderung als Charakter1, Charakter2, Charakter3 … in der Reihenfolge, in der sie erscheinen, und das Modell verschmilzt diese Motive zu einem einzigen zusammenhängenden Video und behält dabei Identität, Farbe, Materialien und Komposition bei.
Anstatt zwischen Text-zu-Video-Freiheit und Bild-zu-Video-Wiedergabetreue zu wählen, können Sie mit dem Modell eine Besetzung – eine Figur, ein Outfit, eine Requisite, ein Accessoire – in einer Aufforderung zusammenbringen und sie mit natürlicher Sprache anleiten. Angetrieben von einem 15B-Parameter-Unified-Transformer mit DMD-2-Destillation liefert das Modell eine 1080p-Ausgabe mit konkurrenzfähiger Geschwindigkeit, ohne Einbußen bei der Gesichtstreue, Kleidungsdetails oder Szenenkontinuität. HappyHorse 1.0 Reference to Video eignet sich für professionelle Produktionen. HappyHorse 1.0 Reference to Video eignet sich für professionelle Produktionen.
Ausgabeformat: Video / Auflösungsstufe: 720P oder 1080P / Dauer: 3–15 Sekunden / Seitenverhältnis: 16:9, 9:16, 1:1, 4:3, 3:4 / Referenzbilder: 1–9 pro Generation Testen Sie HappyHorse 1.0 Reference to Video mit klaren Einzelanweisungen.
| Parameter | Erforderlich | Geben Sie | ein Standard | Sortiment / Optionen | Beschreibung |
|---|---|---|---|---|---|
| image_url_1* | Ja | Zeichenfolge | — | JPEG, JPG, PNG, WEBP | Erstes Referenzbild, in der Eingabeaufforderung als Zeichen1 markiert. |
| image_url_2 … image_url_9 | Nein | Zeichenfolge | — | JPEG, JPG, PNG, WEBP | Optionale zusätzliche Referenzbilder, getaggt als Zeichen2 … Zeichen9. |
| Eingabeaufforderung* | Ja | Zeichenfolge | — | max. 2500 chinesische / 5000 nicht-chinesische Zeichen | Szene, Bewegung, Kamera, Beleuchtung; Verwenden Sie „character1/character2/…“, um auf jedes Bild zu verweisen. |
| Aspektverhältnis | Nein | Zeichenfolge | 16:9 | 16:9, 9:16, 1:1, 4:3, 3:4 | Ausgabe-Seitenverhältnis. |
| Auflösung | Nein | Zeichenfolge | 1080P | 720P, 1080P | Ausgabevideoauflösungsstufe. |
| Dauer | Nein | Ganzzahl | 5 | 3–15 | Dauer des Ausgabevideos in Sekunden. |
| Samen | Nein | Ganzzahl | 0 | 0 bis 2147483647 | Optionaler Zufallsstartwert. Verwenden Sie 0, damit der Anbieter automatisch eine auswählt. |
| Wasserzeichen | Nein | boolescher Wert | falsch | wahr, falsch | Ob das Wasserzeichen des Anbieters in das generierte Video eingefügt werden soll. | Nutzen Sie HappyHorse 1.0 Reference to Video für schnelle Iterationen.
– Dauer außerhalb von 3–15 Sekunden wird in dieser Vorlage nicht angezeigt.
Erstelle filmische Clips mit Audio, nahtlosen Szenen und präziser Steuerung
Erstelle lebensechte Szenen mit präzisem Audio und beeindruckender Bildtreue.
Erstelle flüssige Animationen aus Bildern mit Pikaframes – kreativ, intuitiv, präzise.
Visuelle Konsistenz, realistische Bewegung und kreativer Stil
Erstelle aus Texten beeindruckende KI-Videos mit flüssigen Bewegungen und lebendigen Details.
Erstelle filmische Videos aus Bildern mit schneller, konsistenter Qualität
HappyHorse 1.0 Reference to Video ist der Multi-Image-Subject-to-Video-Modus von HappyHorse 1.0 — dem #1 Arena-Video-Modell (Elo 1392). Er nimmt 1 bis 9 Referenzbilder plus einen Text-Prompt, der jedes Motiv als character1, character2, character3 … markiert, und fusioniert sie zu einem kohärenten 720P/1080P-Clip mit stabiler Identität, Outfit und Requisiten.
Text-to-Video startet nur mit Worten; Image-to-Video animiert ein Einzelbild; Reference-to-Video bringt mehrere Motive (Person, Kostüm, Accessoire, Requisite) in eine Generierung und steuert sie mit einem Prompt. Es verbindet die Freiheit von Text mit der Identitätssicherung von Referenzbildern.
Die Reihenfolge folgt der Upload-Position. Bild 1 ist character1, Bild 2 character2 usw. bis character9. Im Prompt schreiben Sie z. B. „character1 trägt character2, hält character3, geht durch einen sonnigen Korridor“ — das Modell bindet jeden Tag an das passende Referenzbild.
Native 720P oder 1080P-Clips mit wählbarer Dauer 3 bis 15 Sekunden und Seitenverhältnissen 16:9, 9:16, 1:1, 4:3, 3:4. Die Qualität eignet sich für Ads und Social Publishing ohne Nachbearbeitung.
JPEG, JPG, PNG oder WEBP, kurze Seite mindestens 400 px (720P oder höher empfohlen), Dateigröße unter 10MB, öffentliche HTTP/HTTPS-URL. Vermeiden Sie unscharfe, stark komprimierte oder mit Wasserzeichen versehene Quellen.
Verankern Sie jeden character-Tag in einem Satz, beschreiben Sie Bewegung und Kamera: drift, dolly in, orbit, tilt up. Nennen Sie, was fix bleiben soll (Gesicht, Outfit, Verpackung), fügen Sie Lichtentwicklung hinzu und halten Sie einen klaren visuellen Beat pro Clip. Gleichen seed für Vergleiche wiederverwenden.
Multi-Charakter-Storytelling, Virtual Try-on mit Requisiten, Charakter+Outfit+Accessoire-Videos, Brand-Asset-Assembly, Packaging-zu-Präsentation und cinematic Ad-Teaser mit stabiler Identität.
RunComfy ist die führende ComfyUI Plattform, die ComfyUI online Umgebung und Services bietet, zusammen mit ComfyUI Workflows mit atemberaubenden Visualisierungen. RunComfy bietet auch AI Models, Künstlern ermöglichen, die neuesten AI-Tools zu nutzen, um unglaubliche Kunst zu schaffen.





