Erstelle beeindruckende Videos aus Text mit Pika 2.2.


HappyHorse 1.0 I2V auf RunComfy verwendet die asynchrone Videosynthese-API von Alibaba mit dem Modell „happyhorse-1.0-i2v“. Sie laden ein Quellbild hoch, schreiben eine bewegungsfokussierte Eingabeaufforderung und das Modell rendert einen zusammenhängenden kurzen Clip, wobei die Identität, Farbe und Komposition des Motivs aus dem Originalbild erhalten bleiben.
Warum es wichtig ist: HappyHorse 1.0 I2V führt die Bild-zu-Video-Arena Artificial Analysis mit einem Elo von 1392 an, vor Seedance 2.0 und anderen kommerziellen Systemen bei der blinden menschlichen Präferenzabstimmung. Angetrieben von einem 15B-Parameter-Unified-Transformer mit DMD-2-Destillation liefert das Modell eine 1080p-Ausgabe mit konkurrenzfähiger Geschwindigkeit, ohne Einbußen bei der Gesichtstreue, der Produktgeometrie oder der Szenenkontinuität.
Ausgabeformat: Video / Auflösungsstufe: 720P oder 1080P / Dauer: 3–15 Sekunden / Quelle: ein einzelnes Standbild / Seitenverhältnis: folgt dem ersten Bild (kein separater Verhältnisparameter; im Gegensatz zu Text-zu-Video)
| Parameter | Erforderlich | Geben Sie | ein Standard | Sortiment / Optionen | Beschreibung |
|---|---|---|---|---|---|
| image_url* | Ja | Zeichenfolge | — | JPEG, JPG, PNG, WEBP; mindestens 300 Pixel Seiten; 1:2,5–2,5:1; maximal 10 MB | Das erste Bild, das das Modell animiert. |
| Eingabeaufforderung* | Ja | Zeichenfolge | — | max. 5000 Nicht-CJK oder 2500 CJK | Bewegung, Kamera, Beleuchtung und Stimmung (entspricht den Kürzungsregeln des Anbieters). |
| Auflösung | Nein | Zeichenfolge | 1080P | 720P, 1080P | Ausgabevideoauflösungsstufe. |
| Dauer | Nein | Ganzzahl | 5 | 3–15 | Dauer des Ausgabevideos in Sekunden. |
| Samen | Nein | Ganzzahl | 0 | 0 bis 2147483647 | Optionaler Zufallsstartwert. Verwenden Sie 0, damit der Anbieter automatisch eine auswählt. |
| Wasserzeichen | Nein | boolescher Wert | wahr | wahr, falsch | „Happy Horse“-Markierung unten rechts, wenn „true“ (Standardeinstellung des Anbieters). |
– Dauer außerhalb von 3–15 Sekunden wird in dieser Vorlage nicht angezeigt.
Erstelle beeindruckende Videos aus Text mit Pika 2.2.
Realistische Bewegungen, dynamische Kameraführung und präzise Stilsteuerung.
Erstelle dynamische Porträtvideos mit Bewegung und künstlerischem Ausdruck
Verwandelt Bilder mit präziser Bewegungssteuerung in fließende Videos
Erstklassige filmische Text-zu-Video-Umwandlung mit der höchsten visuellen Wiedergabetreue in der Kling V3.0-Familie.
Erzeuge realistische Bewegung und filmische Effekte aus Bildern.
HappyHorse 1.0 I2V ist die Bild-zu-Video-Version von HappyHorse 1.0 – das Modell Nr. 1 in der Bild-zu-Video-Arena Artificial Analysis mit einem Elo von 1392. HappyHorse 1.0 I2V animiert ein einzelnes Quellbild mithilfe eines einheitlichen 15B-Parameter-Transformers in natives 1080p-Video, wobei die Identität des Motivs, die Farbe, die Beleuchtung und die Komposition erhalten bleiben und gleichzeitig physikgenaue Bewegung hinzugefügt wird.
Auf der Artificial Analysis Video Arena (einem blinden A/B-Elo-System mit menschlicher Präferenz) hält HappyHorse 1.0 I2V mit Elo 1392 den ersten Platz in der Bild-zu-Video-Kategorie ohne Audio – etwa 30–50 Elo-Punkte vor Seedance 2.0 und deutlich vor Kling 3.0 Pro, Veo 3.1 und Runway Gen-4.5 (Stand Anfang 2026).
HappyHorse 1.0 I2V gibt native 720P- oder 1080P HD-Clips mit wählbarer Dauer von 3 bis 15 Sekunden aus. Das Ausgabe-Seitenverhältnis richtet sich nach den Proportionen des Quellbilds, und die Detailstufen eignen sich für die Anzeigenbereitstellung und das Social Publishing ohne Neubewertung.
Ja. HappyHorse 1.0 I2V wurde entwickelt, um Gesichtsmerkmale, Produktgeometrie, Verpackungsdetails und die Gesamtkomposition aus dem Eingaberahmen beizubehalten. Es wendet Bewegung, Kamerabewegungen und Lichtentwicklung an und sorgt gleichzeitig dafür, dass Identität und Layout im gesamten Clip stabil bleiben.
Eingabeaufforderungen sollten Bewegung und Kamerasprache beschreiben und nicht wiederholen, was das Bild zeigt. Verwenden Sie Verben wie „driften“, „hineinfahren“, „umkreisen“, „kippen“, „enthüllen“, „blinzeln“ und „atmen“. Geben Sie an, was fest bleiben muss (Identität, Verpackung, Hintergrund); Fügen Sie Lichtentwicklung und Atmosphäre für filmische Ergebnisse hinzu.
HappyHorse 1.0 I2V wird von einem Single-Stream-Selbstaufmerksamkeitstransformator mit 15 Milliarden Parametern und 40 Schichten angetrieben (ein Sandwich-Design – modalitätsspezifische Einbettung/Dekodierung an den Enden, 32 gemeinsame Parameterschichten in der Mitte). Die DMD-2-Destillation reduziert die Inferenz auf 8 Entrauschungsschritte ohne klassifikatorfreie Führung und ermöglicht 1080p-Clips in etwa 38 Sekunden auf einem H100.
HappyHorse 1.0 I2V ist ideal für Produktpräsentationsclips, Porträtanimationen, Charakterbewegungsaufnahmen, filmische Werbeteaser, Übergänge von der Verpackung zur Präsentation und für kurze soziale Inhalte, bei denen Sie bereits über ein starkes Standbild verfügen und dieses mit einer stabilen Identität bewegen müssen.
RunComfy ist die führende ComfyUI Plattform, die ComfyUI online Umgebung und Services bietet, zusammen mit ComfyUI Workflows mit atemberaubenden Visualisierungen. RunComfy bietet auch AI Models, Künstlern ermöglichen, die neuesten AI-Tools zu nutzen, um unglaubliche Kunst zu schaffen.





