Erzeugt fließende Szenenwechsel, natürliche Bewegungen und stabile Animationen.


Diese Vorlage auf RunComfy verwendet Alibabas asynchrone Videosynthese-API mit dem Modell „happyhorse-1.0-r2v“. Sie laden 1 bis 9 Referenzbilder hoch, bezeichnen jedes in der Eingabeaufforderung als Charakter1, Charakter2, Charakter3 … in der Reihenfolge, in der sie erscheinen, und das Modell verschmilzt diese Motive zu einem einzigen zusammenhängenden Video und behält dabei Identität, Farbe, Materialien und Komposition bei.
Anstatt zwischen Text-zu-Video-Freiheit und Bild-zu-Video-Wiedergabetreue zu wählen, können Sie mit dem Modell eine Besetzung – eine Figur, ein Outfit, eine Requisite, ein Accessoire – in einer Aufforderung zusammenbringen und sie mit natürlicher Sprache anleiten. Angetrieben von einem 15B-Parameter-Unified-Transformer mit DMD-2-Destillation liefert das Modell eine 1080p-Ausgabe mit konkurrenzfähiger Geschwindigkeit, ohne Einbußen bei der Gesichtstreue, Kleidungsdetails oder Szenenkontinuität. HappyHorse 1.0 Reference to Video eignet sich für professionelle Produktionen. HappyHorse 1.0 Reference to Video eignet sich für professionelle Produktionen.
Ausgabeformat: Video / Auflösungsstufe: 720P oder 1080P / Dauer: 3–15 Sekunden / Seitenverhältnis: 16:9, 9:16, 1:1, 4:3, 3:4 / Referenzbilder: 1–9 pro Generation Testen Sie HappyHorse 1.0 Reference to Video mit klaren Einzelanweisungen.
| Parameter | Erforderlich | Geben Sie | ein Standard | Sortiment / Optionen | Beschreibung |
|---|---|---|---|---|---|
| image_url_1* | Ja | Zeichenfolge | — | JPEG, JPG, PNG, WEBP | Erstes Referenzbild, in der Eingabeaufforderung als Zeichen1 markiert. |
| image_url_2 … image_url_9 | Nein | Zeichenfolge | — | JPEG, JPG, PNG, WEBP | Optionale zusätzliche Referenzbilder, getaggt als Zeichen2 … Zeichen9. |
| Eingabeaufforderung* | Ja | Zeichenfolge | — | max. 2500 chinesische / 5000 nicht-chinesische Zeichen | Szene, Bewegung, Kamera, Beleuchtung; Verwenden Sie „character1/character2/…“, um auf jedes Bild zu verweisen. |
| Aspektverhältnis | Nein | Zeichenfolge | 16:9 | 16:9, 9:16, 1:1, 4:3, 3:4 | Ausgabe-Seitenverhältnis. |
| Auflösung | Nein | Zeichenfolge | 1080P | 720P, 1080P | Ausgabevideoauflösungsstufe. |
| Dauer | Nein | Ganzzahl | 5 | 3–15 | Dauer des Ausgabevideos in Sekunden. |
| Samen | Nein | Ganzzahl | 0 | 0 bis 2147483647 | Optionaler Zufallsstartwert. Verwenden Sie 0, damit der Anbieter automatisch eine auswählt. |
| Wasserzeichen | Nein | boolescher Wert | falsch | wahr, falsch | Ob das Wasserzeichen des Anbieters in das generierte Video eingefügt werden soll. | Nutzen Sie HappyHorse 1.0 Reference to Video für schnelle Iterationen.
– Dauer außerhalb von 3–15 Sekunden wird in dieser Vorlage nicht angezeigt.
Erzeugt fließende Szenenwechsel, natürliche Bewegungen und stabile Animationen.
Verwandle Bilder in realistische bewegte Szenen mit 2K-Details.
Erstelle aus Texten beeindruckende KI-Videos mit flüssigen Bewegungen und lebendigen Details.
Erstelle beeindruckende Videos mit realistischem Ton per Text mit Sora 2 Pro.
Erstelle in Sekunden realistische Bewegtbilder mit Dreamina 3.0.
Verwandeln Sie statische Bilder in filmreife Videoclips mit flüssigen, realistischen Übergängen und kreativer Flexibilität – powered by Seedance 1.5 Pro.
HappyHorse 1.0 Reference to Video ist der Multi-Image-Subject-to-Video-Modus von HappyHorse 1.0 — dem #1 Arena-Video-Modell (Elo 1392). Er nimmt 1 bis 9 Referenzbilder plus einen Text-Prompt, der jedes Motiv als character1, character2, character3 … markiert, und fusioniert sie zu einem kohärenten 720P/1080P-Clip mit stabiler Identität, Outfit und Requisiten.
Text-to-Video startet nur mit Worten; Image-to-Video animiert ein Einzelbild; Reference-to-Video bringt mehrere Motive (Person, Kostüm, Accessoire, Requisite) in eine Generierung und steuert sie mit einem Prompt. Es verbindet die Freiheit von Text mit der Identitätssicherung von Referenzbildern.
Die Reihenfolge folgt der Upload-Position. Bild 1 ist character1, Bild 2 character2 usw. bis character9. Im Prompt schreiben Sie z. B. „character1 trägt character2, hält character3, geht durch einen sonnigen Korridor“ — das Modell bindet jeden Tag an das passende Referenzbild.
Native 720P oder 1080P-Clips mit wählbarer Dauer 3 bis 15 Sekunden und Seitenverhältnissen 16:9, 9:16, 1:1, 4:3, 3:4. Die Qualität eignet sich für Ads und Social Publishing ohne Nachbearbeitung.
JPEG, JPG, PNG oder WEBP, kurze Seite mindestens 400 px (720P oder höher empfohlen), Dateigröße unter 10MB, öffentliche HTTP/HTTPS-URL. Vermeiden Sie unscharfe, stark komprimierte oder mit Wasserzeichen versehene Quellen.
Verankern Sie jeden character-Tag in einem Satz, beschreiben Sie Bewegung und Kamera: drift, dolly in, orbit, tilt up. Nennen Sie, was fix bleiben soll (Gesicht, Outfit, Verpackung), fügen Sie Lichtentwicklung hinzu und halten Sie einen klaren visuellen Beat pro Clip. Gleichen seed für Vergleiche wiederverwenden.
Multi-Charakter-Storytelling, Virtual Try-on mit Requisiten, Charakter+Outfit+Accessoire-Videos, Brand-Asset-Assembly, Packaging-zu-Präsentation und cinematic Ad-Teaser mit stabiler Identität.
RunComfy is the premier ComfyUI platform, offering ComfyUI online environment and services, along with ComfyUI workflows featuring stunning visuals. RunComfy also provides AI Models, enabling artists to harness the latest AI tools to create incredible art.





