HappyHorse 1.0 Reference to Video: Mehrbild-Subjekt-zu-Video-KI-Modell | Models and API

happyhorse/happyhorse-1.0/reference-to-video

HappyHorse 1.0 Reference to Video verbindet bis zu 9 Referenzbilder mit einer Textaufforderung, um 3–15 Sekunden lange 720P/1080P-Clips auf RunComfy zu generieren – sperren Sie Charaktere, Outfits und Requisiten mit Charakter1/Charakter2-Tags.

Referenzbild 1 (Zeichen1) *

Erstes Referenzbild. Kennzeichnen Sie diesen Betreff in der Eingabeaufforderung als Zeichen1. Format: JPEG, JPG, PNG oder WEBP. Kurze Seite ≥ 400 Pixel, empfohlen 720P oder höher, max. 10 MB.

Referenzbild 2 (Zeichen2)

Optionales zweites Referenzbild. Kennzeichnen Sie diesen Betreff in der Eingabeaufforderung als Zeichen2. Format: JPEG, JPG, PNG oder WEBP. Zum Überspringen leer lassen.

Referenzbild 3 (Zeichen3)

Optionales drittes Referenzbild. Kennzeichnen Sie diesen Betreff in der Eingabeaufforderung als Zeichen3. Format: JPEG, JPG, PNG oder WEBP. Zum Überspringen leer lassen.

Referenzbild 4 (Zeichen4)

Optionales viertes Referenzbild. Kennzeichnen Sie diesen Betreff in der Eingabeaufforderung als Zeichen4. Zum Überspringen leer lassen.

Referenzbild 5 (Zeichen 5)

Optionales fünftes Referenzbild. Kennzeichnen Sie diesen Betreff in der Eingabeaufforderung als Zeichen5. Zum Überspringen leer lassen.

Referenzbild 6 (Zeichen6)

Optionales sechstes Referenzbild. Kennzeichnen Sie diesen Betreff in der Eingabeaufforderung als Zeichen6. Zum Überspringen leer lassen.

Referenzbild 7 (Zeichen7)

Optionales siebtes Referenzbild. Kennzeichnen Sie diesen Betreff in der Eingabeaufforderung als Zeichen7. Zum Überspringen leer lassen.

Referenzbild 8 (Zeichen8)

Optionales achtes Referenzbild. Kennzeichnen Sie diesen Betreff in der Eingabeaufforderung als Zeichen8. Zum Überspringen leer lassen.

Referenzbild 9 (Zeichen9)

Optionales neuntes Referenzbild. Kennzeichnen Sie diesen Betreff in der Eingabeaufforderung als Zeichen9. Zum Überspringen leer lassen.

Prompt *

Beschreiben Sie die Szene, Bewegung, Kamera und Beleuchtung. Beziehen Sie sich auf jedes Referenzbild mit Zeichen1, Zeichen2, Zeichen3 … in der oben aufgeführten Reihenfolge. Maximal 2500 chinesische / 5000 nicht-chinesische Zeichen.

Seitenverhältnis (B:H)

Seitenverhältnis des Ausgabevideos.

Auflösung

Ausgabevideoauflösung. Das Modell unterstützt 720P oder 1080P.

Dauer

Dauer des Ausgabevideos in Sekunden. Zulässige Werte: 3–15.

Samen

Optionales Saatgut für reproduzierbare Generationen. Verwenden Sie 0, um den Anbieter randomisieren zu lassen.

Idle

$0.15 per second for 720P and $0.28 per second for 1080P.

Einführung in HappyHorse 1.0 Reference to Video

HappyHorse 1.0 Reference to Video ist jetzt auf RunComfy über Alibaba verfügbar. Laden Sie 1–9 Referenzbilder hoch, schreiben Sie eine Eingabeaufforderung, die jedes Motiv als Charakter1, Charakter2, Charakter3 … markiert, und das Modell fügt sie zu einem einzigen zusammenhängenden Clip mit stabiler Identität, Kostümtreue und Requisitentreue zusammen. Es basiert auf dem in der Arena am besten bewerteten HappyHorse 1.0 Unified Transformer (Elo 1392) und hält Gesichter, Outfits und Accessoires visuell fest, während es filmische Bewegung in 720P oder 1080P hinzufügt.
Ideal für: Geschichtenerzählen mit mehreren Charakteren | virtuelle Anprobe mit Requisitentausch | Charakter + Outfit + Zubehörvideos | Zusammenbau von Markenwerten | filmische Werbeteaser

HappyHorse 1.0 R2V auf X: Neuigkeiten und Updates

HappyHorse 1.0 R2V auf YouTube: Demos und Rezensionen

HappyHorse 1.0 Reference to Video#

Diese Vorlage auf RunComfy verwendet Alibabas asynchrone Videosynthese-API mit dem Modell „happyhorse-1.0-r2v“. Sie laden 1 bis 9 Referenzbilder hoch, bezeichnen jedes in der Eingabeaufforderung als Charakter1, Charakter2, Charakter3 … in der Reihenfolge, in der sie erscheinen, und das Modell verschmilzt diese Motive zu einem einzigen zusammenhängenden Video und behält dabei Identität, Farbe, Materialien und Komposition bei.

Anstatt zwischen Text-zu-Video-Freiheit und Bild-zu-Video-Wiedergabetreue zu wählen, können Sie mit dem Modell eine Besetzung – eine Figur, ein Outfit, eine Requisite, ein Accessoire – in einer Aufforderung zusammenbringen und sie mit natürlicher Sprache anleiten. Angetrieben von einem 15B-Parameter-Unified-Transformer mit DMD-2-Destillation liefert das Modell eine 1080p-Ausgabe mit konkurrenzfähiger Geschwindigkeit, ohne Einbußen bei der Gesichtstreue, Kleidungsdetails oder Szenenkontinuität. HappyHorse 1.0 Reference to Video eignet sich für professionelle Produktionen. HappyHorse 1.0 Reference to Video eignet sich für professionelle Produktionen.

Ausgabeformat: Video / Auflösungsstufe: 720P oder 1080P / Dauer: 3–15 Sekunden / Seitenverhältnis: 16:9, 9:16, 1:1, 4:3, 3:4 / Referenzbilder: 1–9 pro Generation Testen Sie HappyHorse 1.0 Reference to Video mit klaren Einzelanweisungen.

Parameter HappyHorse 1.0 Reference to Video liefert stabile Identität über den Clip.#

Parameter	Erforderlich	Geben Sie	ein Standard	Sortiment / Optionen	Beschreibung
image_url_1*	Ja	Zeichenfolge	—	JPEG, JPG, PNG, WEBP	Erstes Referenzbild, in der Eingabeaufforderung als Zeichen1 markiert.
image_url_2 … image_url_9	Nein	Zeichenfolge	—	JPEG, JPG, PNG, WEBP	Optionale zusätzliche Referenzbilder, getaggt als Zeichen2 … Zeichen9.
Eingabeaufforderung*	Ja	Zeichenfolge	—	max. 2500 chinesische / 5000 nicht-chinesische Zeichen	Szene, Bewegung, Kamera, Beleuchtung; Verwenden Sie „character1/character2/…“, um auf jedes Bild zu verweisen.
Aspektverhältnis	Nein	Zeichenfolge	16:9	16:9, 9:16, 1:1, 4:3, 3:4	Ausgabe-Seitenverhältnis.
Auflösung	Nein	Zeichenfolge	1080P	720P, 1080P	Ausgabevideoauflösungsstufe.
Dauer	Nein	Ganzzahl	5	3–15	Dauer des Ausgabevideos in Sekunden.
Samen	Nein	Ganzzahl	0	0 bis 2147483647	Optionaler Zufallsstartwert. Verwenden Sie 0, damit der Anbieter automatisch eine auswählt.

Verwendung HappyHorse 1.0 Reference to Video arbeitet asynchron über RunComfy.#

Laden Sie Referenzbild 1 hoch – normalerweise die Hauptfigur – und fügen Sie bis zu 8 weitere für Outfits, Requisiten oder Nebenfiguren hinzu.
Verweisen Sie in der Eingabeaufforderung auf jeden Upload anhand seiner Position: Zeichen1 = Bild 1, Zeichen2 = Bild 2 usw.
Beschreiben Sie Bewegung, Kamerabewegung, Lichtentwicklung und den gewünschten visuellen Takt.
Wählen Sie das Seitenverhältnis 720P oder 1080P und eine Dauer zwischen 3 und 15 Sekunden.
Korrigieren Sie optional den Startwert für wiederholbare Vergleiche.
Senden Sie den fertigen Clip und laden Sie ihn herunter. HappyHorse 1.0 Reference to Video akzeptiert die dokumentierten Formate.

Schnelle Tipps HappyHorse 1.0 Reference to Video unterstützt diesen Workflow.#

Verankern Sie jeden Charakter namentlich in einem Satz: „Charakter 1 trägt Charakter 2, hält Charakter 3 in der Hand und geht durch einen sonnenbeschienenen Korridor.“
Führen Sie mit Bewegungs- und Kameraverben – treiben, hineinfahren, umkreisen, nach oben kippen, schieben, offenbaren.
Geben Sie an, was gesperrt bleiben muss: Gesicht, Outfit, Verpackung, Logo-Platzierung.
Fügen Sie Lichtentwicklung hinzu (Sonne wandert über das Gesicht, Neon flackert), um filmische Ergebnisse zu erzielen.
Halten Sie jeden Clip auf einen klaren visuellen Takt; Das Modell rendert Single-Intent-Aufnahmen am saubersten.
Verwenden Sie scharfe, gut beleuchtete Referenzbilder mit ≥720P; Vermeiden Sie stark komprimierte oder beschnittene Motive.
Verwenden Sie beim Vergleich von Eingabeaufforderungs- oder Referenzvarianten denselben Startwert erneut.

Bildanforderungen HappyHorse 1.0 Reference to Video eignet sich für professionelle Produktionen.#

Format: JPEG, JPG, PNG oder WEBP.
Kurze Seite ≥ 400 Pixel, 720P oder höher empfohlen.
Dateigröße ≤ 10 MB pro Bild.
Öffentliche HTTP/HTTPS-URL; Vermeiden Sie verschwommene, überkomprimierte oder mit Wasserzeichen versehene Quellbilder. Testen Sie HappyHorse 1.0 Reference to Video mit klaren Einzelanweisungen.

Notizen HappyHorse 1.0 Reference to Video liefert stabile Identität über den Clip.#

Bei dieser Vorlage handelt es sich um eine Referenz-zu-Video-Vorlage. Verwenden Sie für Einzelbildanimationen die I2V-Vorlage HappyHorse 1.0 und für die reine Eingabeaufforderungsgenerierung die Text-zu-Video-Vorlage HappyHorse 1.0.

– Dauer außerhalb von 3–15 Sekunden wird in dieser Vorlage nicht angezeigt.

Vom Anbieter zurückgegebene generierte Video-URLs sind 24 Stunden lang gültig. Laden Sie es umgehend herunter oder hosten Sie es erneut.

Häufig gestellte Fragen

Was ist HappyHorse 1.0 Reference to Video?

HappyHorse 1.0 Reference to Video ist der Multi-Image-Subject-to-Video-Modus von HappyHorse 1.0 — dem #1 Arena-Video-Modell (Elo 1392). Er nimmt 1 bis 9 Referenzbilder plus einen Text-Prompt, der jedes Motiv als character1, character2, character3 … markiert, und fusioniert sie zu einem kohärenten 720P/1080P-Clip mit stabiler Identität, Outfit und Requisiten.

Worin unterscheidet es sich von Text-to-Video und Image-to-Video?

Text-to-Video startet nur mit Worten; Image-to-Video animiert ein Einzelbild; Reference-to-Video bringt mehrere Motive (Person, Kostüm, Accessoire, Requisite) in eine Generierung und steuert sie mit einem Prompt. Es verbindet die Freiheit von Text mit der Identitätssicherung von Referenzbildern.

Wie verweise ich im Prompt auf jedes Bild?

Die Reihenfolge folgt der Upload-Position. Bild 1 ist character1, Bild 2 character2 usw. bis character9. Im Prompt schreiben Sie z. B. „character1 trägt character2, hält character3, geht durch einen sonnigen Korridor“ — das Modell bindet jeden Tag an das passende Referenzbild.

Welche Auflösung und Dauer liefert das Modell?

Native 720P oder 1080P-Clips mit wählbarer Dauer 3 bis 15 Sekunden und Seitenverhältnissen 16:9, 9:16, 1:1, 4:3, 3:4. Die Qualität eignet sich für Ads und Social Publishing ohne Nachbearbeitung.

Anforderungen an Referenzbilder?

JPEG, JPG, PNG oder WEBP, kurze Seite mindestens 400 px (720P oder höher empfohlen), Dateigröße unter 10MB, öffentliche HTTP/HTTPS-URL. Vermeiden Sie unscharfe, stark komprimierte oder mit Wasserzeichen versehene Quellen.

Welche Prompts funktionieren am besten?

Verankern Sie jeden character-Tag in einem Satz, beschreiben Sie Bewegung und Kamera: drift, dolly in, orbit, tilt up. Nennen Sie, was fix bleiben soll (Gesicht, Outfit, Verpackung), fügen Sie Lichtentwicklung hinzu und halten Sie einen klaren visuellen Beat pro Clip. Gleichen seed für Vergleiche wiederverwenden.

Typische Anwendungsfälle?

Multi-Charakter-Storytelling, Virtual Try-on mit Requisiten, Charakter+Outfit+Accessoire-Videos, Brand-Asset-Assembly, Packaging-zu-Präsentation und cinematic Ad-Teaser mit stabiler Identität.

RunComfy

RunComfy ist die führende ComfyUI Plattform, die ComfyUI online Umgebung und Services bietet, zusammen mit ComfyUI Workflows mit atemberaubenden Visualisierungen. RunComfy bietet auch AI Models, Künstlern ermöglichen, die neuesten AI-Tools zu nutzen, um unglaubliche Kunst zu schaffen.