Créez des vidéos réalistes à partir de texte avec Sora 2 et un son parfaitement synchronisé.


Ce modèle sur RunComfy utilise l'API de synthèse vidéo asynchrone d'Alibaba avec le modèle « happyhorse-1.0-r2v ». Vous téléchargez 1 à 9 images de référence, faites référence à chacune d'elles dans l'invite comme personnage1, personnage2, personnage3… dans l'ordre dans lequel elles apparaissent, et le modèle fusionne ces sujets en une seule vidéo cohérente tout en préservant l'identité, la couleur, les matériaux et la composition. Con HappyHorse 1.0 Reference to Video obtiene resultados consistentes.
Au lieu de choisir entre la liberté texte-vidéo et la fidélité image-vidéo, le modèle vous permet de regrouper un casting (un personnage, une tenue, un accessoire, un accessoire) dans une seule invite et de les diriger avec un langage naturel. Alimenté par un transformateur unifié à paramètres 15B avec distillation DMD-2, le modèle offre une sortie 1080p à une vitesse compétitive sans sacrifier la fidélité du visage, les détails des vêtements ou la continuité de la scène. HappyHorse 1.0 Reference to Video es ideal para producción profesional.
Format de sortie : vidéo / niveau de résolution : 720P ou 1080P / durée : 3 à 15 secondes / format d'image : 16:9, 9:16, 1:1, 4:3, 3:4 / images de référence : 1 à 9 par génération Pruebe HappyHorse 1.0 Reference to Video con instrucciones claras.
| Paramètre | Obligatoire | Tapez | Par défaut | Gamme / Options | Descriptif |
|---|---|---|---|---|---|
| image_url_1* | Oui | chaîne | — | JPEG, JPG, PNG, WEBP | Première image de référence, étiquetée comme caractère1 dans l'invite. |
| image_url_2 … image_url_9 | Non | chaîne | — | JPEG, JPG, PNG, WEBP | Images de référence supplémentaires facultatives, étiquetées comme caractère2… caractère9. |
| invite* | Oui | chaîne | — | max 2 500 caractères chinois / 5 000 caractères non chinois | Scène, mouvement, caméra, éclairage ; utilisez caractère1/caractère2/… pour référencer chaque image. |
| rapport_aspect | Non | chaîne | 16:9 | 16:9, 9:16, 1:1, 4:3, 3:4 | Rapport hauteur/largeur de sortie. |
| résolution | Non | chaîne | 1080P | 720P, 1080P | Niveau de résolution vidéo de sortie. |
| durée | Non | entier | 5 | 3-15 | Durée de la vidéo de sortie en secondes. |
| graine | Non | entier | 0 | 0 au 2147483647 | Graine aléatoire facultative. Utilisez 0 pour laisser le fournisseur en choisir un automatiquement. |
| filigrane | Non | booléen | faux | vrai, faux | S'il faut inclure le filigrane du fournisseur sur la vidéo générée. | Use HappyHorse 1.0 Reference to Video para iterar rápidamente.
-Format : JPEG, JPG, PNG ou WEBP.
HappyHorse 1.0 Reference to Video accepte jusqu'à neuf références. HappyHorse 1.0 Reference to Video préserve l'identité. HappyHorse 1.0 Reference to Video produit des clips 720P/1080P sur RunComfy. HappyHorse 1.0 Reference to Video utilise les tags character1/character2. HappyHorse 1.0 Reference to Video convient aux publicités.
Créez des vidéos réalistes à partir de texte avec Sora 2 et un son parfaitement synchronisé.
Créez des vidéos fluides et réalistes à partir d’images statiques
Créez des vidéos immersives à partir de texte avec Sora 2, l'IA audio-visuelle d'OpenAI.
Transformez vos images en vidéos réalistes avec effets et mouvements fluides.
Personnalisez vos vidéos avec styles IA et effets LoRA modulables
Vidéo réaliste, mouvements fluides et cohérence visuelle assurée
HappyHorse 1.0 Reference to Video est le mode sujet-vers-vidéo multi-images de HappyHorse 1.0 — modèle vidéo n°1 sur Arena (Elo 1392). Il accepte 1 à 9 images de référence et un prompt taguant chaque sujet character1, character2, character3… pour les fusionner en un clip 720P/1080P cohérent avec identité, tenue et accessoires stables.
Le text-to-video part des mots seuls ; l'image-to-video anime une image ; le reference-to-video réunit plusieurs sujets (personne, costume, accessoire, accessoire de scène) dans une génération pilotée par un prompt, alliant liberté textuelle et verrouillage d'identité.
L'ordre suit l'upload : image 1 = character1, image 2 = character2, jusqu'à character9. Ex. : « character1 porte character2, tient character3, marche dans un couloir ensoleillé » — chaque tag est lié à sa référence.
Clips natifs 720P ou 1080P, durée 3 à 15 secondes, ratios 16:9, 9:16, 1:1, 4:3, 3:4. Qualité adaptée aux ads et réseaux sociaux sans regrading.
JPEG, JPG, PNG ou WEBP, côté court ≥400 px (720P+ recommandé), <10MB, URL HTTP/HTTPS publique. Évitez flou, forte compression ou filigrane.
Ancrer chaque tag character, décrire mouvement et caméra (drift, dolly in, orbit), préciser ce qui reste verrouillé (visage, tenue, packaging), ajouter évolution lumineuse, un beat visuel par clip. Réutiliser le seed pour comparer.
Storytelling multi-personnages, essayage virtuel avec props, vidéos personnage+tenue+accessoire, assemblage d'assets de marque, transitions packaging-présentation, teasers publicitaires cinématographiques.
RunComfy is the premier ComfyUI platform, offering ComfyUI online environment and services, along with ComfyUI workflows featuring stunning visuals. RunComfy also provides AI Models, enabling artists to harness the latest AI tools to create incredible art.





