Convierte texto o imágenes en videos cinematográficos precisos


Esta plantilla en RunComfy utiliza la API de síntesis de video asíncrona de Alibaba con el modelo happyhorse-1.0-r2v. Subes de 1 a 9 imágenes de referencia, te refieres a cada una en el mensaje como personaje1, personaje2, personaje3... en el orden en que aparecen, y el modelo fusiona esos sujetos en un único vídeo coherente preservando al mismo tiempo la identidad, el color, los materiales y la composición. Con HappyHorse 1.0 Reference to Video obtiene resultados consistentes. Pruebe HappyHorse 1.0 Reference to Video con instrucciones claras.
En lugar de elegir entre la libertad de texto a video y la fidelidad de imagen a video, el modelo te permite reunir un elenco (un personaje, un atuendo, un accesorio, un accesorio) en una sola indicación y dirigirlos con lenguaje natural. Impulsado por un transformador unificado de parámetros 15B con destilación DMD-2, el modelo ofrece una salida de 1080p a una velocidad competitiva sin sacrificar la fidelidad facial, los detalles de la prenda o la continuidad de la escena. HappyHorse 1.0 Reference to Video es ideal para producción profesional.
Formato de salida: vídeo/nivel de resolución: 720P o 1080P/duración: 3 a 15 segundos/relación de aspecto: 16:9, 9:16, 1:1, 4:3, 3:4/imágenes de referencia: 1 a 9 por generación Pruebe HappyHorse 1.0 Reference to Video con instrucciones claras.
| Parámetro | Requerido | Tipo | Predeterminado | Gama / Opciones | Descripción |
|---|---|---|---|---|---|
| imagen_url_1* | Sí | cadena | — | JPEG, JPG, PNG, WEBP | Primera imagen de referencia, etiquetada como carácter1 en el mensaje. |
| imagen_url_2… imagen_url_9 | No | cadena | — | JPEG, JPG, PNG, WEBP | Imágenes de referencia adicionales opcionales, etiquetadas como carácter2... carácter9. |
| mensaje* | Sí | cadena | — | máx. 2500 caracteres chinos / 5000 caracteres no chinos | Escena, movimiento, cámara, iluminación; utilice carácter1/carácter2/… para hacer referencia a cada imagen. |
| relación_de aspecto | No | cadena | 16:9 | 16:9, 9:16, 1:1, 4:3, 3:4 | Relación de aspecto de salida. |
| resolución | No | cadena | 1080P | 720P, 1080P | Nivel de resolución de vídeo de salida. |
| duración | No | entero | 5 | 3–15 | Duración del vídeo de salida en segundos. |
| semilla | No | entero | 0 | 0 al 2147483647 | Semilla aleatoria opcional. Utilice 0 para permitir que el proveedor elija uno automáticamente. |
| marca de agua | No | booleano | falso | verdadero, falso | Si se debe incluir la marca de agua del proveedor en el video generado. | Use HappyHorse 1.0 Reference to Video para iterar rápidamente.
HappyHorse 1.0 Reference to Video admite hasta nueve referencias. HappyHorse 1.0 Reference to Video mantiene identidad estable. HappyHorse 1.0 Reference to Video genera clips 720P/1080P en RunComfy. HappyHorse 1.0 Reference to Video usa etiquetas character1/character2. HappyHorse 1.0 Reference to Video es ideal para anuncios.
Convierte texto o imágenes en videos cinematográficos precisos
Convierte imágenes en videos naturales con transiciones precisas
Crea imágenes realistas al instante a partir de texto con Wan 2.2.
Crea videos animados a partir de hasta 6 imágenes con total control.
Convierte imágenes en videos realistas con efectos cinematográficos.
Más de 400 movimientos, 33 gestos faciales y realismo total
HappyHorse 1.0 Reference to Video es el modo multiimagen subject-to-video de HappyHorse 1.0 — el modelo de vídeo #1 en Arena (Elo 1392). Acepta de 1 a 9 imágenes de referencia más un prompt que etiqueta cada sujeto como character1, character2, character3… y los fusiona en un clip 720P/1080P coherente con identidad, outfit y props estables.
Text-to-video parte solo de palabras; image-to-video anima un fotograma; reference-to-video reúne varios sujetos (persona, traje, accesorio, prop) en una generación y los dirige con un prompt. Combina la libertad del texto con el bloqueo de identidad de las referencias.
El orden sigue la posición de subida. Imagen 1 = character1, imagen 2 = character2, hasta character9. Escriba p. ej. «character1 lleva character2, sostiene character3, camina por un corredor iluminado» — el modelo enlaza cada etiqueta con su referencia.
Clips nativos 720P o 1080P con duración 3 a 15 segundos y relaciones 16:9, 9:16, 1:1, 4:3, 3:4. Calidad apta para anuncios y redes sin regradado.
JPEG, JPG, PNG o WEBP, lado corto ≥400 px (720P+ recomendado), <10MB, URL HTTP/HTTPS pública. Evite fuentes borrosas, muy comprimidas o con marca de agua.
Anclar cada etiqueta character en una frase; describir movimiento y cámara (drift, dolly in, orbit). Indicar qué debe permanecer fijo (rostro, outfit, empaque), añadir evolución de luz y un solo beat visual por clip. Reutilizar seed para comparar variantes.
Historias multicharacter, virtual try-on con props, vídeos personaje+outfit+accesorio, ensamblaje de activos de marca, transiciones packaging-a-presentación y teasers publicitarios cinematográficos.
RunComfy es la principal ComfyUI plataforma, ofreciendo ComfyUI en línea entorno y servicios, junto con flujos de trabajo de ComfyUI con impresionantes imágenes. RunComfy también ofrece AI Models, permitiendo a los artistas aprovechar las últimas herramientas de AI para crear arte increíble.





