Transforme imagens em vídeos animados com efeitos criativos e rápida exportação.


Este modelo no RunComfy usa a API de síntese de vídeo assíncrona do Alibaba com o modelo happyhorse-1.0-r2v. Você carrega de 1 a 9 imagens de referência, refere-se a cada uma delas no prompt como personagem1, personagem2, personagem3... na ordem em que aparecem, e o modelo funde esses assuntos em um único vídeo coerente, preservando a identidade, a cor, os materiais e a composição.
Em vez de escolher entre a liberdade de texto para vídeo e a fidelidade de imagem para vídeo, o modelo permite reunir um elenco – um personagem, uma roupa, um adereço, um acessório – em um único prompt e direcioná-los com linguagem natural. Alimentado por um transformador unificado de 15 parâmetros B com destilação DMD-2, o modelo oferece saída de 1080p em velocidade competitiva sem sacrificar a fidelidade facial, os detalhes da roupa ou a continuidade da cena.
Formato de saída: vídeo/nível de resolução: 720P ou 1080P/duração: 3–15 segundos/proporção: 16:9, 9:16, 1:1, 4:3, 3:4/imagens de referência: 1–9 por geração
| Parâmetro | Obrigatório | Tipo | Padrão | Gama / Opções | Descrição |
|---|---|---|---|---|---|
| imagem_url_1* | Sim | corda | — | JPEG, JPG, PNG, WEBP | Primeira imagem de referência, marcada como character1 no prompt. |
| imagem_url_2… imagem_url_9 | Não | corda | — | JPEG, JPG, PNG, WEBP | Imagens de referência adicionais opcionais, marcadas como personagem2… personagem9. |
| alerta* | Sim | corda | — | máximo de 2.500 caracteres chineses/5.000 caracteres não chineses | Cena, movimento, câmera, iluminação; use character1/character2/… para fazer referência a cada imagem. |
| proporção_de_aspecto | Não | corda | 16:9 | 16:9, 9:16, 1:1, 4:3, 3:4 | Proporção de aspecto de saída. |
| resolução | Não | corda | 1080P | 720P, 1080P | Camada de resolução de vídeo de saída. |
| duração | Não | inteiro | 5 | 3–15 | Duração do vídeo de saída em segundos. |
| semente | Não | inteiro | 0 | 0 a 2147483647 | Semente aleatória opcional. Use 0 para permitir que o provedor escolha um automaticamente. |
| marca d'água | Não | booleano | falso | verdadeiro, falso | Se deve incluir a marca d'água do provedor no vídeo gerado. |
Transforme imagens em vídeos animados com efeitos criativos e rápida exportação.
Transforme imagens em vídeos criativos com o Pika 2.2.
Crie vídeos cinematográficos em segundos com Veo 3.1 Fast, gerando animações a partir de texto com total controle criativo.
Transforme imagens em vídeos realistas com o Kling 2.1 Pro.
Crie vídeos realistas a partir de texto com o poder do Luma Ray 2.
Gere vídeos em HD com IA a partir de imagens, com movimento fluido e alta precisão
HappyHorse 1.0 Reference to Video é o modo multiimagem assunto para vídeo do HappyHorse 1.0 – o modelo de vídeo nº 1 classificado na Arena (Elo 1392). Ele aceita de 1 a 9 imagens de referência, além de um prompt de texto que marca cada sujeito como personagem1, personagem2, personagem3… e, em seguida, os funde em um único clipe 720P/1080P coerente com identidade, roupa e fidelidade de acessórios estáveis.
A conversão de texto em vídeo começa apenas com palavras; imagem para vídeo anima um quadro de origem; reference-to-video traz vários assuntos (uma pessoa, uma fantasia, um acessório, um adereço) na mesma geração e permite direcioná-los com um único prompt. Ele combina a liberdade da solicitação de texto com a força de bloqueio de identidade das imagens de referência.
A ordem de referência é fixada pela posição de upload. A imagem 1 é o personagem1, a imagem 2 é o personagem2, a imagem 3 é o personagem3 e assim por diante até o personagem9. No seu prompt, você escreve algo como “personagem1 vestindo personagem2, segurando personagem3, andando por um corredor iluminado pelo sol” – o modelo vincula cada tag à imagem de referência correspondente.
O modelo produz clipes nativos de 720P ou 1080P com durações selecionáveis de 3 a 15 segundos, em proporções de 16:9, 9:16, 1:1, 4:3 e 3:4. A qualidade da saída é adequada para entrega de anúncios e publicação social sem reavaliação.
Cada imagem de referência deve ser JPEG, JPG, PNG ou WEBP, com um lado curto de pelo menos 400 pixels (720P ou superior recomendado) e um tamanho de arquivo inferior a 10 MB, servido a partir de um URL HTTP/HTTPS público. Evite fontes borradas, muito compactadas ou com marca d’água – referências nítidas e bem iluminadas dão ao modelo a melhor chance de bloquear a identidade.
Ancore cada tag de personagem em uma frase e, em seguida, descreva o movimento e a linguagem da câmera: deriva, movimentar-se, orbitar, inclinar para cima, empurrar, revelar. Indique o que deve permanecer bloqueado (rosto, roupa, embalagem), adicione evolução de iluminação para uma sensação cinematográfica e mantenha cada clipe em uma batida visual clara. Reutilize a mesma semente ao comparar variantes de prompt ou de referência.
O modelo é ideal para narrativa de vários personagens, experimentação virtual com trocas de acessórios, vídeos de personagem + roupa + acessórios, montagem de ativos de marca, transições de embalagem para apresentação e teasers de anúncios cinematográficos onde você já tem um elenco de ativos de referência e precisa que eles se movam juntos com uma identidade estável.
RunComfy is the premier ComfyUI platform, offering ComfyUI online environment and services, along with ComfyUI workflows featuring stunning visuals. RunComfy also provides AI Models, enabling artists to harness the latest AI tools to create incredible art.





