HappyHorse 1.0 Riferimento al video: modello AI soggetto a video multi-immagine | CorriComodo | Models and API

happyhorse/happyhorse-1.0/reference-to-video

HappyHorse 1.0 Reference to Video unisce fino a 9 immagini di riferimento con un messaggio di testo per generare clip 720P/1080P da 3 a 15 secondi su RunComfy: blocca personaggi, abiti e oggetti di scena con i tag personaggio1/personaggio2.

Immagine di riferimento 1 (personaggio1) *

Prima immagine di riferimento. Contrassegna questo argomento nel prompt come carattere1. Formato: JPEG, JPG, PNG o WEBP. Lato corto ≥ 400px, consigliato 720P o superiore, max 10MB.

Immagine di riferimento 2 (personaggio2)

Seconda immagine di riferimento opzionale. Contrassegna questo argomento nel prompt come carattere2. Formato: JPEG, JPG, PNG o WEBP. Lascia vuoto per saltare.

Immagine di riferimento 3 (carattere3)

Terza immagine di riferimento opzionale. Contrassegna questo argomento nel prompt come carattere3. Formato: JPEG, JPG, PNG o WEBP. Lascia vuoto per saltare.

Immagine di riferimento 4 (carattere 4)

Quarta immagine di riferimento opzionale. Contrassegna questo argomento nel prompt come carattere4. Lascia vuoto per saltare.

Immagine di riferimento 5 (carattere5)

Quinta immagine di riferimento opzionale. Contrassegna questo argomento nel prompt come carattere5. Lascia vuoto per saltare.

Immagine di riferimento 6 (carattere6)

Sesta immagine di riferimento opzionale. Contrassegna questo argomento nel prompt come carattere6. Lascia vuoto per saltare.

Immagine di riferimento 7 (carattere7)

Settima immagine di riferimento opzionale. Contrassegna questo argomento nel prompt come carattere7. Lascia vuoto per saltare.

Immagine di riferimento 8 (carattere 8)

Ottava immagine di riferimento opzionale. Contrassegna questo argomento nel prompt come carattere8. Lascia vuoto per saltare.

Immagine di riferimento 9 (carattere 9)

Nona immagine di riferimento opzionale. Contrassegna questo argomento nel prompt come carattere9. Lascia vuoto per saltare.

Prompt *

Descrivi la scena, il movimento, la telecamera e l'illuminazione. Fai riferimento a ciascuna immagine di riferimento con carattere1, carattere2, carattere3... nell'ordine in cui appaiono sopra. Massimo 2500 caratteri cinesi/5000 non cinesi.

Proporzioni (L:A)

Proporzioni video in uscita.

Risoluzione

Risoluzione video in uscita. Il modello supporta 720P o 1080P.

Durata

Durata del video in uscita in secondi. Valori consentiti: 3–15.

Seme

Seme opzionale per generazioni riproducibili. Utilizzare 0 per consentire al provider di randomizzare.

Idle

$0.15 per second for 720P and $0.28 per second for 1080P.

Introduzione a HappyHorse 1.0 Riferimento al video

HappyHorse 1.0 Reference to Video è ora disponibile su RunComfy tramite Alibaba. Carica da 1 a 9 immagini di riferimento, scrivi un messaggio che tagghi ciascun soggetto come personaggio1, personaggio2, personaggio3... e il modello le compone in un'unica clip coerente con identità, costume e fedeltà stabili dell'oggetto di scena. Costruito sul trasformatore unificato HappyHorse 1.0 numero 1 nell'arena (Elo 1392), mantiene volti, abiti e accessori visivamente bloccati aggiungendo movimento cinematografico in 720P o 1080P.
Ideale per: narrazione con più personaggi | prova virtuale con scambio di oggetti | personaggio + outfit + video accessori | assemblaggio delle risorse del marchio | teaser pubblicitari cinematografici

HappyHorse 1.0 R2V su X: novità e aggiornamenti

HappyHorse 1.0 R2V su YouTube: demo e recensioni

HappyHorse 1.0 Reference to Video HappyHorse 1.0 Reference to Video admite este flujo de trabajo. HappyHorse 1.0 Reference to Video es ideal para producción profesional.#

Questo modello su RunComfy utilizza l'API di sintesi video asincrona di Alibaba con il modello "happyhorse-1.0-r2v". Carichi da 1 a 9 immagini di riferimento, fai riferimento a ciascuna di esse nel prompt come personaggio1, personaggio2, personaggio3... nell'ordine in cui appaiono e il modello fonde questi soggetti in un unico video coerente preservando identità, colore, materiali e composizione. Con HappyHorse 1.0 Reference to Video obtiene resultados consistentes.

Invece di scegliere tra libertà da testo a video e fedeltà da immagine a video, il modello ti consente di riunire un cast - un personaggio, un vestito, un oggetto di scena, un accessorio - in un unico prompt e dirigerli con un linguaggio naturale. Alimentato da un trasformatore unificato con parametri 15B con distillazione DMD-2, il modello offre un output 1080p a velocità competitiva senza sacrificare la fedeltà del viso, i dettagli degli indumenti o la continuità della scena. HappyHorse 1.0 Reference to Video es ideal para producción profesional.

Formato di output: video/livello di risoluzione: 720P o 1080P/durata: 3–15 secondi/proporzioni: 16:9, 9:16, 1:1, 4:3, 3:4/immagini di riferimento: 1–9 per generazione Pruebe HappyHorse 1.0 Reference to Video con instrucciones claras.

Parametri HappyHorse 1.0 Reference to Video mantiene identidad estable en el clip.#

Parametro	Obbligatorio	Digitare	Predefinito	Gamma / Opzioni	Descrizione
immagine_url_1*	Sì	stringa	—	JPEG, JPG, PNG, WEBP	Prima immagine di riferimento, contrassegnata come carattere1 nel prompt.
url_immagine_2 … url_immagine_9	No	stringa	—	JPEG, JPG, PNG, WEBP	Immagini di riferimento aggiuntive facoltative, contrassegnate come carattere2 … carattere9.
richiesta*	Sì	stringa	—	max 2500 caratteri cinesi / 5000 caratteri non cinesi	Scena, movimento, telecamera, illuminazione; utilizzare carattere1/carattere2/… per fare riferimento a ciascuna immagine.
rapporto_aspetto	No	stringa	16:9	16:9, 9:16, 1:1, 4:3, 3:4	Proporzioni di uscita.
risoluzione	No	stringa	1080P	720P, 1080P	Livello di risoluzione video in uscita.
durata	No	intero	5	3–15	Durata del video in uscita in secondi.
seme	No	intero	0	da 0 a 2147483647	Seme casuale opzionale. Utilizza 0 per consentire al provider di sceglierne uno automaticamente.

Come usare HappyHorse 1.0 Reference to Video admite este flujo de trabajo.#

Carica l'immagine di riferimento 1 (di solito il personaggio principale) e aggiungine fino a altre 8 per abiti, oggetti di scena o personaggi secondari.
Nel prompt, fai riferimento a ciascun caricamento in base alla sua posizione: carattere1 = immagine 1, carattere2 = immagine 2 e così via.
Descrivi il movimento, il movimento della telecamera, l'evoluzione dell'illuminazione e il ritmo visivo che desideri.
Scegli le proporzioni, 720P o 1080P e una durata compresa tra 3 e 15 secondi.
Facoltativamente, correggere il seme per confronti ripetibili.
Invia e scarica la clip finita. Con HappyHorse 1.0 Reference to Video obtiene resultados consistentes.

Suggerimenti rapidi HappyHorse 1.0 Reference to Video es ideal para producción profesional.#

Ancora ogni personaggio per nome in una frase: "personaggio1 che indossa il personaggio2, tiene in mano il personaggio3, cammina attraverso un corridoio illuminato dal sole."
Guida con i verbi di movimento e della telecamera: vai alla deriva, dolly in, orbita, inclina verso l'alto, spingi, rivela.
Specificare cosa deve rimanere bloccato: volto, outfit, packaging, posizionamento del logo.
Aggiungi l'evoluzione dell'illuminazione (il sole che si muove sul viso, i neon che lampeggiano) per risultati cinematografici.
Mantieni ogni clip su un battito visivo chiaro; il modello rende gli scatti con un unico intento in modo più pulito.
Utilizzare immagini di riferimento nitide, ben illuminate, ≥720P; evitare soggetti fortemente compressi o ritagliati.
Riutilizzare lo stesso seme quando si confrontano varianti di prompt o di riferimento. Pruebe HappyHorse 1.0 Reference to Video con instrucciones claras.

Requisiti dell'immagine HappyHorse 1.0 Reference to Video mantiene identidad estable en el clip.#

Formato: JPEG, JPG, PNG o WEBP.
Lato corto ≥ 400px, 720P o superiore consigliato.
Dimensione file ≤ 10 MB per immagine.
URL HTTP/HTTPS pubblico; evitare immagini sorgente sfocate, eccessivamente compresse o con filigrana. Use HappyHorse 1.0 Reference to Video para iterar rápidamente.

Note HappyHorse 1.0 Reference to Video admite este flujo de trabajo.#

Questo modello è un riferimento al video; per l'animazione a immagine singola utilizzare il modello I2V HappyHorse 1.0 e per la generazione di soli prompt utilizzare il modello da testo a video HappyHorse 1.0.
La durata diversa da 3 a 15 secondi non è esposta in questo modello.
Gli URL dei video generati restituiti dal fornitore sono validi per 24 ore; scaricare o rehostare tempestivamente. Con HappyHorse 1.0 Reference to Video obtiene resultados consistentes.

HappyHorse 1.0 Reference to Video accetta fino a nove riferimenti. HappyHorse 1.0 Reference to Video preserva l'identità. HappyHorse 1.0 Reference to Video genera clip 720P/1080P su RunComfy. HappyHorse 1.0 Reference to Video usa tag character1/character2. HappyHorse 1.0 Reference to Video è ideale per annunci.

Modelli correlati

sora-2/text-to-video

Genera un video con audio sincronizzato da un prompt di testo obbligatorio. Scegli `1280x720` o `720x1280` e una durata di `4`, `8` o `12` secondi.

wan-2-2/text-to-video

Crea con Wan 2.2 Plus un video di cinque secondi da un prompt e scegli dimensioni, seed ed espansione del prompt.

pixverse/v5.5/text-to-video

Genera un video da un prompt testuale obbligatorio con controlli precisi per proporzioni, risoluzione, durata, stile, seed, audio, più clip e ottimizzazione.

kling-video-o3/standard/text-to-video

Genera dal testo video cinematografici di 3–15 s con audio opzionale.

infinite-talk/fast

Genera un video da una traccia audio e un’immagine, con prompt e seed facoltativi.

kling-1-6/pro/text-to-video

Genera un video di 5 o 10 secondi da un prompt richiesto. Scegli `16:9`, `9:16` o `1:1`, aggiungi un prompt negativo facoltativo e regola l'intensità del prompt.

Domande Frequenti

Cos'è HappyHorse 1.0 Reference to Video?

HappyHorse 1.0 Reference to Video è la modalità multi-immagine subject-to-video di HappyHorse 1.0 — modello video #1 su Arena (Elo 1392). Accetta da 1 a 9 immagini di riferimento e un prompt che tagga ogni soggetto come character1, character2, character3… fondendoli in un clip 720P/1080P coerente con identità, outfit e props stabili.

In cosa differisce da text-to-video e image-to-video?

Il text-to-video parte solo dal testo; l'image-to-video anima un frame; il reference-to-video unisce più soggetti (persona, costume, accessorio, prop) in una generazione guidata da un prompt, combinando libertà testuale e blocco identitario.

Come riferire ogni immagine nel prompt?

L'ordine segue l'upload: immagine 1 = character1, immagine 2 = character2, fino a character9. Es.: «character1 indossa character2, tiene character3, cammina in un corridoio soleggiato».

Risoluzione e durata in uscita?

Clip native 720P o 1080P, durata 3–15 secondi, aspect ratio 16:9, 9:16, 1:1, 4:3, 3:4. Qualità adatta ad ads e social senza regrading.

Requisiti immagini di riferimento?

JPEG, JPG, PNG o WEBP, lato corto ≥400 px (720P+ consigliato), <10MB, URL HTTP/HTTPS pubblico. Evitare sfocature, compressione eccessiva o watermark.

Prompt migliori?

Ancorare ogni tag character, descrivere movimento e camera (drift, dolly in, orbit), indicare cosa resta bloccato, aggiungere evoluzione luce, un beat visivo per clip. Riutilizzare seed per confronti.

Casi d'uso tipici?

Storytelling multi-personaggio, virtual try-on con props, video personaggio+outfit+accessorio, assembly asset di brand, teaser pubblicitari cinematografici.

RunComfy

RunComfy è la piattaforma principale ComfyUI che offre ComfyUI online ambiente e servizi, insieme a workflow di ComfyUI con visuali mozzafiato. RunComfy offre anche AI Models, consentire agli artisti di sfruttare gli ultimi strumenti di AI per creare arte incredibile.