Referencia de vídeo de HappyHorse 1.0: modelo de IA de sujeto a vídeo de múltiples imágenes | Corre cómodo | Models and API

happyhorse/happyhorse-1.0/reference-to-video

HappyHorse 1.0 Reference to Video fusiona hasta 9 imágenes de referencia con un mensaje de texto para generar clips de 3 a 15 segundos de 720P/1080P en RunComfy: bloquea personajes, atuendos y accesorios con etiquetas de personaje1/personaje2.

Imagen de referencia 1 (carácter1) *

Primera imagen de referencia. Etiqueta este tema en el mensaje como personaje1. Formato: JPEG, JPG, PNG o WEBP. Lado corto ≥ 400px, recomendado 720P o superior, máximo 10MB.

Imagen de referencia 2 (personaje2)

Segunda imagen de referencia opcional. Etiqueta este tema en el mensaje como personaje2. Formato: JPEG, JPG, PNG o WEBP. Déjelo en blanco para omitir.

Imagen de referencia 3 (personaje3)

Tercera imagen de referencia opcional. Etiqueta este tema en el mensaje como personaje3. Formato: JPEG, JPG, PNG o WEBP. Déjelo en blanco para omitir.

Imagen de referencia 4 (personaje4)

Cuarta imagen de referencia opcional. Etiqueta este tema en el mensaje como personaje4. Déjelo en blanco para omitir.

Imagen de referencia 5 (personaje5)

Quinta imagen de referencia opcional. Etiqueta este tema en el mensaje como personaje5. Déjelo en blanco para omitir.

Imagen de referencia 6 (personaje6)

Sexta imagen de referencia opcional. Etiqueta este tema en el mensaje como personaje6. Déjelo en blanco para omitir.

Imagen de referencia 7 (personaje7)

Séptima imagen de referencia opcional. Etiqueta este tema en el mensaje como personaje7. Déjelo en blanco para omitir.

Imagen de referencia 8 (personaje8)

Opcional octava imagen de referencia. Etiqueta este tema en el mensaje como personaje8. Déjelo en blanco para omitir.

Imagen de referencia 9 (personaje9)

Novena imagen de referencia opcional. Etiqueta este tema en el mensaje como personaje9. Déjelo en blanco para omitir.

Prompt *

Describe la escena, el movimiento, la cámara y la iluminación. Consulte cada imagen de referencia con carácter1, carácter2, carácter3… en el orden en que aparecen arriba. Máximo 2500 caracteres chinos / 5000 no chinos.

Relación de aspecto (W:H)

Relación de aspecto del vídeo de salida.

Resolución

Resolución de vídeo de salida. El modelo admite 720P o 1080P.

Duración

Duración del vídeo de salida en segundos. Valores permitidos: 3–15.

Semilla

Semilla opcional para generaciones reproducibles. Utilice 0 para permitir que el proveedor realice la aleatorización.

Idle

$0.15 per second for 720P and $0.28 per second for 1080P.

Introducción a HappyHorse 1.0 Referencia al vídeo

HappyHorse 1.0 Reference to Video ya está disponible en RunComfy a través de Alibaba. Cargue de 1 a 9 imágenes de referencia, escriba una indicación que etiquete a cada sujeto como personaje1, personaje2, personaje3... y el modelo las compondrá en un único clip coherente con identidad, vestuario y fidelidad estables. Construido sobre el transformador unificado HappyHorse 1.0 número uno en el ranking Arena (Elo 1392), mantiene las caras, los atuendos y los accesorios visualmente bloqueados mientras agrega movimiento cinematográfico en 720P o 1080P.
Ideal para: narración de varios personajes | prueba virtual con intercambios de accesorios | vídeos de personaje + outfit + accesorios | montaje de activos de marca | avances de anuncios cinematográficos

HappyHorse 1.0 R2V en X: noticias y actualizaciones

HappyHorse 1.0 R2V en YouTube: demostraciones y reseñas

HappyHorse 1.0 Reference to Video HappyHorse 1.0 Reference to Video admite este flujo de trabajo. HappyHorse 1.0 Reference to Video es ideal para producción profesional.#

Esta plantilla en RunComfy utiliza la API de síntesis de video asíncrona de Alibaba con el modelo happyhorse-1.0-r2v. Subes de 1 a 9 imágenes de referencia, te refieres a cada una en el mensaje como personaje1, personaje2, personaje3... en el orden en que aparecen, y el modelo fusiona esos sujetos en un único vídeo coherente preservando al mismo tiempo la identidad, el color, los materiales y la composición. Con HappyHorse 1.0 Reference to Video obtiene resultados consistentes. Pruebe HappyHorse 1.0 Reference to Video con instrucciones claras.

En lugar de elegir entre la libertad de texto a video y la fidelidad de imagen a video, el modelo te permite reunir un elenco (un personaje, un atuendo, un accesorio, un accesorio) en una sola indicación y dirigirlos con lenguaje natural. Impulsado por un transformador unificado de parámetros 15B con destilación DMD-2, el modelo ofrece una salida de 1080p a una velocidad competitiva sin sacrificar la fidelidad facial, los detalles de la prenda o la continuidad de la escena. HappyHorse 1.0 Reference to Video es ideal para producción profesional.

Formato de salida: vídeo/nivel de resolución: 720P o 1080P/duración: 3 a 15 segundos/relación de aspecto: 16:9, 9:16, 1:1, 4:3, 3:4/imágenes de referencia: 1 a 9 por generación Pruebe HappyHorse 1.0 Reference to Video con instrucciones claras.

Parámetros HappyHorse 1.0 Reference to Video mantiene identidad estable en el clip.#

Parámetro	Requerido	Tipo	Predeterminado	Gama / Opciones	Descripción
imagen_url_1*	Sí	cadena	—	JPEG, JPG, PNG, WEBP	Primera imagen de referencia, etiquetada como carácter1 en el mensaje.
imagen_url_2… imagen_url_9	No	cadena	—	JPEG, JPG, PNG, WEBP	Imágenes de referencia adicionales opcionales, etiquetadas como carácter2... carácter9.
mensaje*	Sí	cadena	—	máx. 2500 caracteres chinos / 5000 caracteres no chinos	Escena, movimiento, cámara, iluminación; utilice carácter1/carácter2/… para hacer referencia a cada imagen.
relación_de aspecto	No	cadena	16:9	16:9, 9:16, 1:1, 4:3, 3:4	Relación de aspecto de salida.
resolución	No	cadena	1080P	720P, 1080P	Nivel de resolución de vídeo de salida.
duración	No	entero	5	3–15	Duración del vídeo de salida en segundos.
semilla	No	entero	0	0 al 2147483647	Semilla aleatoria opcional. Utilice 0 para permitir que el proveedor elija uno automáticamente.

Cómo utilizar HappyHorse 1.0 Reference to Video admite este flujo de trabajo.#

Sube la imagen de referencia 1, generalmente el personaje principal, y agrega hasta 8 más para atuendos, accesorios o personajes secundarios.
En el mensaje, haga referencia a cada carga por su posición: carácter1 = imagen 1, carácter2 = imagen 2, etc.
Describe el movimiento, el movimiento de la cámara, la evolución de la iluminación y el ritmo visual que deseas.
Elija la relación de aspecto, 720P o 1080P, y una duración de entre 3 y 15 segundos.
Opcionalmente, arregle la semilla para realizar comparaciones repetibles.
Envíe y descargue el clip terminado. Con HappyHorse 1.0 Reference to Video obtiene resultados consistentes.

Consejos rápidos HappyHorse 1.0 Reference to Video es ideal para producción profesional.#

Ancla cada personaje por su nombre en una frase: "personaje1 vistiendo al personaje2, sosteniendo al personaje3, caminando por un pasillo iluminado por el sol".
Liderar con verbos de movimiento y cámara: derivar, desplazarse, orbitar, inclinar hacia arriba, empujar, revelar.
Especifique qué debe permanecer bloqueado: cara, vestimenta, empaque, ubicación del logotipo.
Agregue evolución de iluminación (sol moviéndose por la cara, neón parpadeando) para obtener resultados cinematográficos.
Mantenga cada clip con un ritmo visual claro; el modelo reproduce tomas de un solo intento de manera más limpia.
Utilice imágenes de referencia ≥720P nítidas y bien iluminadas; Evite sujetos muy comprimidos o recortados.
Reutilizar la misma semilla al comparar variantes rápidas o de referencia. Pruebe HappyHorse 1.0 Reference to Video con instrucciones claras.

Requisitos de imagen HappyHorse 1.0 Reference to Video mantiene identidad estable en el clip.#

Formato: JPEG, JPG, PNG o WEBP.
Lado corto ≥ 400px, se recomienda 720P o superior.
Tamaño de archivo ≤ 10 MB por imagen.
URL pública HTTP/HTTPS; Evite imágenes de origen borrosas, demasiado comprimidas o con marcas de agua. Use HappyHorse 1.0 Reference to Video para iterar rápidamente.

Notas HappyHorse 1.0 Reference to Video admite este flujo de trabajo.#

Esta plantilla es de referencia a vídeo; para animaciones de una sola imagen, utilice la plantilla I2V de HappyHorse 1.0 y, para la generación de mensajes únicamente, utilice la plantilla de texto a vídeo de HappyHorse 1.0.
La duración fuera de 3 a 15 segundos no se expone en esta plantilla.
Las URL de vídeo generadas devueltas por el proveedor son válidas durante 24 horas; descargar o volver a alojar de inmediato. Con HappyHorse 1.0 Reference to Video obtiene resultados consistentes.

HappyHorse 1.0 Reference to Video admite hasta nueve referencias. HappyHorse 1.0 Reference to Video mantiene identidad estable. HappyHorse 1.0 Reference to Video genera clips 720P/1080P en RunComfy. HappyHorse 1.0 Reference to Video usa etiquetas character1/character2. HappyHorse 1.0 Reference to Video es ideal para anuncios.

Modelos relacionados

sora-2/image-to-video

Genera videos realistas a partir de imágenes con audio natural y fluidez excepcional.

hunyuan-video-v1.5/text-to-video

Genera un vídeo de 5 u 8 segundos a partir de un prompt obligatorio, con un prompt negativo opcional, cuatro tamaños de salida exactos y control de semilla.

SkyReels V1

Más de 400 movimientos, 33 gestos faciales y realismo total

runway-aleph/video-to-video

Edición cinematográfica con control de estilo y objetos

wan-2-1/lora

Genere vídeos con Wan 2.1 mediante una URL de LoRA personalizada y controles detallados de salida y muestreo.

veo-3/text-to-video

Crea un vídeo con Google Veo 3 a partir de un prompt de texto y elige si quieres generar audio.

Preguntas Frecuentes

¿Qué es HappyHorse 1.0 Reference to Video?

HappyHorse 1.0 Reference to Video es el modo multiimagen subject-to-video de HappyHorse 1.0 — el modelo de vídeo #1 en Arena (Elo 1392). Acepta de 1 a 9 imágenes de referencia más un prompt que etiqueta cada sujeto como character1, character2, character3… y los fusiona en un clip 720P/1080P coherente con identidad, outfit y props estables.

¿En qué se diferencia de text-to-video e image-to-video?

Text-to-video parte solo de palabras; image-to-video anima un fotograma; reference-to-video reúne varios sujetos (persona, traje, accesorio, prop) en una generación y los dirige con un prompt. Combina la libertad del texto con el bloqueo de identidad de las referencias.

¿Cómo referenciar cada imagen en el prompt?

El orden sigue la posición de subida. Imagen 1 = character1, imagen 2 = character2, hasta character9. Escriba p. ej. «character1 lleva character2, sostiene character3, camina por un corredor iluminado» — el modelo enlaza cada etiqueta con su referencia.

¿Resolución y duración de salida?

Clips nativos 720P o 1080P con duración 3 a 15 segundos y relaciones 16:9, 9:16, 1:1, 4:3, 3:4. Calidad apta para anuncios y redes sin regradado.

Requisitos de imágenes de referencia?

JPEG, JPG, PNG o WEBP, lado corto ≥400 px (720P+ recomendado), <10MB, URL HTTP/HTTPS pública. Evite fuentes borrosas, muy comprimidas o con marca de agua.

¿Qué prompts funcionan mejor?

Anclar cada etiqueta character en una frase; describir movimiento y cámara (drift, dolly in, orbit). Indicar qué debe permanecer fijo (rostro, outfit, empaque), añadir evolución de luz y un solo beat visual por clip. Reutilizar seed para comparar variantes.

Casos de uso típicos?

Historias multicharacter, virtual try-on con props, vídeos personaje+outfit+accesorio, ensamblaje de activos de marca, transiciones packaging-a-presentación y teasers publicitarios cinematográficos.

RunComfy

RunComfy es la principal ComfyUI plataforma, ofreciendo ComfyUI en línea entorno y servicios, junto con flujos de trabajo de ComfyUI con impresionantes imágenes. RunComfy también ofrece AI Models, permitiendo a los artistas aprovechar las últimas herramientas de AI para crear arte increíble.