Créez des vidéos immersives à partir de textes ou d’images en un clic


Ce modèle sur RunComfy utilise l'API de synthèse vidéo asynchrone d'Alibaba avec le modèle « happyhorse-1.0-r2v ». Vous téléchargez 1 à 9 images de référence, faites référence à chacune d'elles dans l'invite comme personnage1, personnage2, personnage3… dans l'ordre dans lequel elles apparaissent, et le modèle fusionne ces sujets en une seule vidéo cohérente tout en préservant l'identité, la couleur, les matériaux et la composition. Con HappyHorse 1.0 Reference to Video obtiene resultados consistentes.
Au lieu de choisir entre la liberté texte-vidéo et la fidélité image-vidéo, le modèle vous permet de regrouper un casting (un personnage, une tenue, un accessoire, un accessoire) dans une seule invite et de les diriger avec un langage naturel. Alimenté par un transformateur unifié à paramètres 15B avec distillation DMD-2, le modèle offre une sortie 1080p à une vitesse compétitive sans sacrifier la fidélité du visage, les détails des vêtements ou la continuité de la scène. HappyHorse 1.0 Reference to Video es ideal para producción profesional.
Format de sortie : vidéo / niveau de résolution : 720P ou 1080P / durée : 3 à 15 secondes / format d'image : 16:9, 9:16, 1:1, 4:3, 3:4 / images de référence : 1 à 9 par génération Pruebe HappyHorse 1.0 Reference to Video con instrucciones claras.
| Paramètre | Obligatoire | Tapez | Par défaut | Gamme / Options | Descriptif |
|---|---|---|---|---|---|
| image_url_1* | Oui | chaîne | — | JPEG, JPG, PNG, WEBP | Première image de référence, étiquetée comme caractère1 dans l'invite. |
| image_url_2 … image_url_9 | Non | chaîne | — | JPEG, JPG, PNG, WEBP | Images de référence supplémentaires facultatives, étiquetées comme caractère2… caractère9. |
| invite* | Oui | chaîne | — | max 2 500 caractères chinois / 5 000 caractères non chinois | Scène, mouvement, caméra, éclairage ; utilisez caractère1/caractère2/… pour référencer chaque image. |
| rapport_aspect | Non | chaîne | 16:9 | 16:9, 9:16, 1:1, 4:3, 3:4 | Rapport hauteur/largeur de sortie. |
| résolution | Non | chaîne | 1080P | 720P, 1080P | Niveau de résolution vidéo de sortie. |
| durée | Non | entier | 5 | 3-15 | Durée de la vidéo de sortie en secondes. |
| graine | Non | entier | 0 | 0 au 2147483647 | Graine aléatoire facultative. Utilisez 0 pour laisser le fournisseur en choisir un automatiquement. |
| filigrane | Non | booléen | faux | vrai, faux | S'il faut inclure le filigrane du fournisseur sur la vidéo générée. | Use HappyHorse 1.0 Reference to Video para iterar rápidamente.
-Format : JPEG, JPG, PNG ou WEBP.
HappyHorse 1.0 Reference to Video accepte jusqu'à neuf références. HappyHorse 1.0 Reference to Video préserve l'identité. HappyHorse 1.0 Reference to Video produit des clips 720P/1080P sur RunComfy. HappyHorse 1.0 Reference to Video utilise les tags character1/character2. HappyHorse 1.0 Reference to Video convient aux publicités.
Créez des vidéos immersives à partir de textes ou d’images en un clic
Créez des vidéos 1080P saisissantes à partir de texte avec Kling 2.5 Turbo.
Créez des films multi-scènes avec des dialogues synchronisés et des personnages cohérents. Use Kling 3.0 on RunComfy.
Créez des vidéos fluides et réalistes à partir d’images statiques
Transformez vos images en vidéos cinématiques fluides avec réalisme
Transformez vos vidéos avec Hunyuan Video pour un rendu fluide et créatif.
HappyHorse 1.0 Reference to Video est le mode sujet-vers-vidéo multi-images de HappyHorse 1.0 — modèle vidéo n°1 sur Arena (Elo 1392). Il accepte 1 à 9 images de référence et un prompt taguant chaque sujet character1, character2, character3… pour les fusionner en un clip 720P/1080P cohérent avec identité, tenue et accessoires stables.
Le text-to-video part des mots seuls ; l'image-to-video anime une image ; le reference-to-video réunit plusieurs sujets (personne, costume, accessoire, accessoire de scène) dans une génération pilotée par un prompt, alliant liberté textuelle et verrouillage d'identité.
L'ordre suit l'upload : image 1 = character1, image 2 = character2, jusqu'à character9. Ex. : « character1 porte character2, tient character3, marche dans un couloir ensoleillé » — chaque tag est lié à sa référence.
Clips natifs 720P ou 1080P, durée 3 à 15 secondes, ratios 16:9, 9:16, 1:1, 4:3, 3:4. Qualité adaptée aux ads et réseaux sociaux sans regrading.
JPEG, JPG, PNG ou WEBP, côté court ≥400 px (720P+ recommandé), <10MB, URL HTTP/HTTPS publique. Évitez flou, forte compression ou filigrane.
Ancrer chaque tag character, décrire mouvement et caméra (drift, dolly in, orbit), préciser ce qui reste verrouillé (visage, tenue, packaging), ajouter évolution lumineuse, un beat visuel par clip. Réutiliser le seed pour comparer.
Storytelling multi-personnages, essayage virtuel avec props, vidéos personnage+tenue+accessoire, assemblage d'assets de marque, transitions packaging-présentation, teasers publicitaires cinématographiques.
RunComfy est la première ComfyUI plateforme, offrant des ComfyUI en ligne environnement et services, ainsi que des workflows ComfyUI proposant des visuels époustouflants. RunComfy propose également AI Models, permettant aux artistes d'utiliser les derniers outils d'IA pour créer des œuvres d'art incroyables.





