Référence HappyHorse 1.0 à la vidéo : modèle d'IA multi-images soumis à la vidéo | CourirConfort | Models and API

happyhorse/happyhorse-1.0/reference-to-video

HappyHorse 1.0 Reference to Video fusionne jusqu'à 9 images de référence avec une invite de texte pour générer des clips 720P/1080P de 3 à 15 secondes sur RunComfy — verrouillez les personnages, les tenues et les accessoires avec les balises caractère1/caractère2.

Image de référence 1 (personnage 1) *

Première image de référence. Marquez ce sujet dans l'invite comme caractère1. Format : JPEG, JPG, PNG ou WEBP. Côté court ≥ 400 px, recommandé 720P ou supérieur, max 10 Mo.

Image de référence 2 (personnage 2)

Deuxième image de référence facultative. Marquez ce sujet dans l'invite comme caractère2. Format : JPEG, JPG, PNG ou WEBP. Laissez vide pour sauter.

Image de référence 3 (personnage 3)

Troisième image de référence facultative. Marquez ce sujet dans l'invite comme caractère3. Format : JPEG, JPG, PNG ou WEBP. Laissez vide pour sauter.

Image de référence 4 (personnage4)

Quatrième image de référence facultative. Marquez ce sujet dans l'invite comme caractère4. Laissez vide pour sauter.

Image de référence 5 (personnage5)

Cinquième image de référence facultative. Marquez ce sujet dans l'invite comme caractère5. Laissez vide pour sauter.

Image de référence 6 (personnage6)

Sixième image de référence facultative. Marquez ce sujet dans l'invite comme caractère6. Laissez vide pour sauter.

Image de référence 7 (personnage7)

Septième image de référence facultative. Marquez ce sujet dans l'invite comme caractère7. Laissez vide pour sauter.

Image de référence 8 (personnage 8)

Huitième image de référence facultative. Marquez ce sujet dans l'invite comme caractère8. Laissez vide pour sauter.

Image de référence 9 (personnage 9)

Neuvième image de référence facultative. Marquez ce sujet dans l'invite comme caractère9. Laissez vide pour sauter.

Prompt *

Décrivez la scène, le mouvement, la caméra et l'éclairage. Faites référence à chaque image de référence avec caractère1, caractère2, caractère3… dans l'ordre dans lequel elles apparaissent ci-dessus. Max 2 500 caractères chinois / 5 000 caractères non chinois.

Rapport hauteur/largeur (L:H)

Rapport d’aspect de la vidéo de sortie.

Résolution

Résolution vidéo de sortie. Le modèle prend en charge 720P ou 1080P.

Durée

Durée de la vidéo de sortie en secondes. Valeurs autorisées : 3 à 15.

Graine

Semence facultative pour des générations reproductibles. Utilisez 0 pour laisser le fournisseur randomiser.

Idle

$0.15 per second for 720P and $0.28 per second for 1080P.

Introduction à HappyHorse 1.0 Référence à la vidéo

HappyHorse 1.0 Reference to Video est désormais disponible sur RunComfy via Alibaba. Téléchargez 1 à 9 images de référence, écrivez une invite qui marque chaque sujet comme personnage1, personnage2, personnage3…, et le modèle les compose en un seul clip cohérent avec une identité, un costume et une fidélité stables. Construit sur le transformateur unifié HappyHorse 1.0 (Elo 1392), classé n°1 dans l'arène, il maintient les visages, les tenues et les accessoires visuellement verrouillés tout en ajoutant un mouvement cinématographique en 720P ou 1080P.
Idéal pour : la narration à plusieurs personnages | essai virtuel avec échanges d'accessoires | vidéos personnage + tenue + accessoire | assemblage d'actifs de marque | teasers publicitaires cinématographiques

HappyHorse 1.0 R2V sur X : Actualités et mises à jour

HappyHorse 1.0 R2V sur YouTube : démos et critiques

HappyHorse 1.0 Reference to Video HappyHorse 1.0 Reference to Video admite este flujo de trabajo. HappyHorse 1.0 Reference to Video es ideal para producción profesional.#

Ce modèle sur RunComfy utilise l'API de synthèse vidéo asynchrone d'Alibaba avec le modèle « happyhorse-1.0-r2v ». Vous téléchargez 1 à 9 images de référence, faites référence à chacune d'elles dans l'invite comme personnage1, personnage2, personnage3… dans l'ordre dans lequel elles apparaissent, et le modèle fusionne ces sujets en une seule vidéo cohérente tout en préservant l'identité, la couleur, les matériaux et la composition. Con HappyHorse 1.0 Reference to Video obtiene resultados consistentes.

Au lieu de choisir entre la liberté texte-vidéo et la fidélité image-vidéo, le modèle vous permet de regrouper un casting (un personnage, une tenue, un accessoire, un accessoire) dans une seule invite et de les diriger avec un langage naturel. Alimenté par un transformateur unifié à paramètres 15B avec distillation DMD-2, le modèle offre une sortie 1080p à une vitesse compétitive sans sacrifier la fidélité du visage, les détails des vêtements ou la continuité de la scène. HappyHorse 1.0 Reference to Video es ideal para producción profesional.

Format de sortie : vidéo / niveau de résolution : 720P ou 1080P / durée : 3 à 15 secondes / format d'image : 16:9, 9:16, 1:1, 4:3, 3:4 / images de référence : 1 à 9 par génération Pruebe HappyHorse 1.0 Reference to Video con instrucciones claras.

Paramètres HappyHorse 1.0 Reference to Video mantiene identidad estable en el clip.#

Paramètre	Obligatoire	Tapez	Par défaut	Gamme / Options	Descriptif
image_url_1*	Oui	chaîne	—	JPEG, JPG, PNG, WEBP	Première image de référence, étiquetée comme caractère1 dans l'invite.
image_url_2 … image_url_9	Non	chaîne	—	JPEG, JPG, PNG, WEBP	Images de référence supplémentaires facultatives, étiquetées comme caractère2… caractère9.
invite*	Oui	chaîne	—	max 2 500 caractères chinois / 5 000 caractères non chinois	Scène, mouvement, caméra, éclairage ; utilisez caractère1/caractère2/… pour référencer chaque image.
rapport_aspect	Non	chaîne	16:9	16:9, 9:16, 1:1, 4:3, 3:4	Rapport hauteur/largeur de sortie.
résolution	Non	chaîne	1080P	720P, 1080P	Niveau de résolution vidéo de sortie.
durée	Non	entier	5	3-15	Durée de la vidéo de sortie en secondes.
graine	Non	entier	0	0 au 2147483647	Graine aléatoire facultative. Utilisez 0 pour laisser le fournisseur en choisir un automatiquement.

Comment utiliser HappyHorse 1.0 Reference to Video admite este flujo de trabajo.#

Téléchargez l’image de référence 1 – généralement le personnage principal – et ajoutez-en jusqu’à 8 autres pour les tenues, les accessoires ou les personnages secondaires.
Dans l'invite, référencez chaque téléchargement par sa position : caractère1 = image 1, caractère2 = image 2, et ainsi de suite.
Décrivez le mouvement, le mouvement de la caméra, l'évolution de l'éclairage et le rythme visuel souhaité.
Choisissez le rapport hauteur/largeur, 720P ou 1080P, et une durée comprise entre 3 et 15 secondes.
Corrigez éventuellement la graine pour des comparaisons reproductibles.
Soumettez et téléchargez le clip terminé. Con HappyHorse 1.0 Reference to Video obtiene resultados consistentes.

Conseils rapides HappyHorse 1.0 Reference to Video es ideal para producción profesional.#

Ancrez chaque personnage par son nom dans une phrase : "personnage1 portant le personnage2, tenant le personnage3, marchant dans un couloir ensoleillé."
Dirigez avec des verbes de mouvement et de caméra : dérive, chariot, orbite, inclinaison vers le haut, pousser, révéler.
Précisez ce qui doit rester verrouillé : visage, tenue, packaging, emplacement du logo.
Ajoutez une évolution de l'éclairage (soleil se déplaçant sur le visage, néon scintillant) pour des résultats cinématographiques.
Gardez chaque clip sur un rythme visuel clair ; le modèle restitue les prises de vue à intention unique de la manière la plus nette.
Utilisez des images de référence nettes et bien éclairées ≥720P ; évitez les sujets fortement compressés ou rognés.
Réutilisez la même graine lors de la comparaison des variantes d'invite ou de référence. Pruebe HappyHorse 1.0 Reference to Video con instrucciones claras.

Exigences relatives aux images HappyHorse 1.0 Reference to Video mantiene identidad estable en el clip.#

-Format : JPEG, JPG, PNG ou WEBP.

Côté court ≥ 400px, 720P ou supérieur recommandé.
Taille du fichier ≤ 10 Mo par image.
URL publique HTTP/HTTPS ; évitez les images sources floues, surcompressées ou filigranées. Use HappyHorse 1.0 Reference to Video para iterar rápidamente.

Remarques HappyHorse 1.0 Reference to Video admite este flujo de trabajo.#

Ce modèle fait référence à une vidéo ; pour l'animation d'une seule image, utilisez le modèle HappyHorse 1.0 I2V et pour la génération d'invites uniquement, utilisez le modèle texte-vidéo HappyHorse 1.0.
La durée en dehors de 3 à 15 secondes n'est pas exposée dans ce modèle.
Les URL vidéo générées renvoyées par le fournisseur sont valables 24 heures ; téléchargez ou réhébergez rapidement. Con HappyHorse 1.0 Reference to Video obtiene resultados consistentes.

HappyHorse 1.0 Reference to Video accepte jusqu'à neuf références. HappyHorse 1.0 Reference to Video préserve l'identité. HappyHorse 1.0 Reference to Video produit des clips 720P/1080P sur RunComfy. HappyHorse 1.0 Reference to Video utilise les tags character1/character2. HappyHorse 1.0 Reference to Video convient aux publicités.

Modèles associés

veo-3-1/fast/extend-video

Prolongez une vidéo existante de 7 secondes en 720p, avec guidage par prompt et génération audio facultative.

infinite-talk/fast

Générez une vidéo à partir d’une piste audio et d’une image, avec prompt et seed facultatifs.

dreamina-3-0/text-to-video

Créez des vidéos réalistes instantanément avec Dreamina 3.0, l'outil IA pour créateurs.

sync/lipsync/v2

Créez une vidéo synchronisée sur les lèvres à partir des URL vidéo et audio requises. Choisissez `lipsync-2` ou `lipsync-2-pro` (Pro coûte environ 1,67 fois plus cher pour la même durée) et sélectionnez l'un des cinq modes de non-concordance de durée.

kling-video-o1/image-to-video

Générez une vidéo de 5 ou 10 secondes entre une image de début et une image de fin obligatoires. Décrivez la transition dans le prompt avec @Image1 et @Image2.

wan-2-2/image-to-video

Animation IA fluide, contrôle instantané et effets pro pour créateurs

Questions Fréquemment Posées

Qu'est-ce que HappyHorse 1.0 Reference to Video ?

HappyHorse 1.0 Reference to Video est le mode sujet-vers-vidéo multi-images de HappyHorse 1.0 — modèle vidéo n°1 sur Arena (Elo 1392). Il accepte 1 à 9 images de référence et un prompt taguant chaque sujet character1, character2, character3… pour les fusionner en un clip 720P/1080P cohérent avec identité, tenue et accessoires stables.

Différence avec text-to-video et image-to-video ?

Le text-to-video part des mots seuls ; l'image-to-video anime une image ; le reference-to-video réunit plusieurs sujets (personne, costume, accessoire, accessoire de scène) dans une génération pilotée par un prompt, alliant liberté textuelle et verrouillage d'identité.

Comment référencer chaque image dans le prompt ?

L'ordre suit l'upload : image 1 = character1, image 2 = character2, jusqu'à character9. Ex. : « character1 porte character2, tient character3, marche dans un couloir ensoleillé » — chaque tag est lié à sa référence.

Résolution et durée de sortie ?

Clips natifs 720P ou 1080P, durée 3 à 15 secondes, ratios 16:9, 9:16, 1:1, 4:3, 3:4. Qualité adaptée aux ads et réseaux sociaux sans regrading.

Exigences pour les images de référence ?

JPEG, JPG, PNG ou WEBP, côté court ≥400 px (720P+ recommandé), <10MB, URL HTTP/HTTPS publique. Évitez flou, forte compression ou filigrane.

Quels prompts fonctionnent le mieux ?

Ancrer chaque tag character, décrire mouvement et caméra (drift, dolly in, orbit), préciser ce qui reste verrouillé (visage, tenue, packaging), ajouter évolution lumineuse, un beat visuel par clip. Réutiliser le seed pour comparer.

Cas d'usage typiques ?

Storytelling multi-personnages, essayage virtuel avec props, vidéos personnage+tenue+accessoire, assemblage d'assets de marque, transitions packaging-présentation, teasers publicitaires cinématographiques.

RunComfy

RunComfy est la première ComfyUI plateforme, offrant des ComfyUI en ligne environnement et services, ainsi que des workflows ComfyUI proposant des visuels époustouflants. RunComfy propose également AI Models, permettant aux artistes d'utiliser les derniers outils d'IA pour créer des œuvres d'art incroyables.