Crea video realistici da immagini con audio sincronizzato e movimenti fluidi


Questo modello su RunComfy utilizza l'API di sintesi video asincrona di Alibaba con il modello "happyhorse-1.0-r2v". Carichi da 1 a 9 immagini di riferimento, fai riferimento a ciascuna di esse nel prompt come personaggio1, personaggio2, personaggio3... nell'ordine in cui appaiono e il modello fonde questi soggetti in un unico video coerente preservando identità, colore, materiali e composizione. Con HappyHorse 1.0 Reference to Video obtiene resultados consistentes.
Invece di scegliere tra libertà da testo a video e fedeltà da immagine a video, il modello ti consente di riunire un cast - un personaggio, un vestito, un oggetto di scena, un accessorio - in un unico prompt e dirigerli con un linguaggio naturale. Alimentato da un trasformatore unificato con parametri 15B con distillazione DMD-2, il modello offre un output 1080p a velocità competitiva senza sacrificare la fedeltà del viso, i dettagli degli indumenti o la continuità della scena. HappyHorse 1.0 Reference to Video es ideal para producción profesional.
Formato di output: video/livello di risoluzione: 720P o 1080P/durata: 3–15 secondi/proporzioni: 16:9, 9:16, 1:1, 4:3, 3:4/immagini di riferimento: 1–9 per generazione Pruebe HappyHorse 1.0 Reference to Video con instrucciones claras.
| Parametro | Obbligatorio | Digitare | Predefinito | Gamma / Opzioni | Descrizione |
|---|---|---|---|---|---|
| immagine_url_1* | Sì | stringa | — | JPEG, JPG, PNG, WEBP | Prima immagine di riferimento, contrassegnata come carattere1 nel prompt. |
| url_immagine_2 … url_immagine_9 | No | stringa | — | JPEG, JPG, PNG, WEBP | Immagini di riferimento aggiuntive facoltative, contrassegnate come carattere2 … carattere9. |
| richiesta* | Sì | stringa | — | max 2500 caratteri cinesi / 5000 caratteri non cinesi | Scena, movimento, telecamera, illuminazione; utilizzare carattere1/carattere2/… per fare riferimento a ciascuna immagine. |
| rapporto_aspetto | No | stringa | 16:9 | 16:9, 9:16, 1:1, 4:3, 3:4 | Proporzioni di uscita. |
| risoluzione | No | stringa | 1080P | 720P, 1080P | Livello di risoluzione video in uscita. |
| durata | No | intero | 5 | 3–15 | Durata del video in uscita in secondi. |
| seme | No | intero | 0 | da 0 a 2147483647 | Seme casuale opzionale. Utilizza 0 per consentire al provider di sceglierne uno automaticamente. |
| filigrana | No | booleano | falso | vero, falso | Se includere la filigrana del provider nel video generato. | Use HappyHorse 1.0 Reference to Video para iterar rápidamente.
HappyHorse 1.0 Reference to Video accetta fino a nove riferimenti. HappyHorse 1.0 Reference to Video preserva l'identità. HappyHorse 1.0 Reference to Video genera clip 720P/1080P su RunComfy. HappyHorse 1.0 Reference to Video usa tag character1/character2. HappyHorse 1.0 Reference to Video è ideale per annunci.
Crea video realistici da immagini con audio sincronizzato e movimenti fluidi
Trasforma le tue immagini in video realistici con controllo creativo e fluido.
Converti testi in video dinamici con l'intelligenza artificiale.
Trasforma facilmente un'immagine statica in un video fluido e realistico.
Trasforma le foto in clip in movimento cinematografiche con il controllo della fotocamera e dell'audio.
Crea video dinamici e cinematografici in pochi secondi da una singola immagine con Veo 3.1 Fast.
HappyHorse 1.0 Reference to Video è la modalità multi-immagine subject-to-video di HappyHorse 1.0 — modello video #1 su Arena (Elo 1392). Accetta da 1 a 9 immagini di riferimento e un prompt che tagga ogni soggetto come character1, character2, character3… fondendoli in un clip 720P/1080P coerente con identità, outfit e props stabili.
Il text-to-video parte solo dal testo; l'image-to-video anima un frame; il reference-to-video unisce più soggetti (persona, costume, accessorio, prop) in una generazione guidata da un prompt, combinando libertà testuale e blocco identitario.
L'ordine segue l'upload: immagine 1 = character1, immagine 2 = character2, fino a character9. Es.: «character1 indossa character2, tiene character3, cammina in un corridoio soleggiato».
Clip native 720P o 1080P, durata 3–15 secondi, aspect ratio 16:9, 9:16, 1:1, 4:3, 3:4. Qualità adatta ad ads e social senza regrading.
JPEG, JPG, PNG o WEBP, lato corto ≥400 px (720P+ consigliato), <10MB, URL HTTP/HTTPS pubblico. Evitare sfocature, compressione eccessiva o watermark.
Ancorare ogni tag character, descrivere movimento e camera (drift, dolly in, orbit), indicare cosa resta bloccato, aggiungere evoluzione luce, un beat visivo per clip. Riutilizzare seed per confronti.
Storytelling multi-personaggio, virtual try-on con props, video personaggio+outfit+accessorio, assembly asset di brand, teaser pubblicitari cinematografici.
RunComfy is the premier ComfyUI platform, offering ComfyUI online environment and services, along with ComfyUI workflows featuring stunning visuals. RunComfy also provides AI Models, enabling artists to harness the latest AI tools to create incredible art.





