Transforme fotos em clipes de movimento cinematográficos com controle de câmera e áudio.


Este modelo no RunComfy usa a API de síntese de vídeo assíncrona do Alibaba com o modelo happyhorse-1.0-r2v. Você carrega de 1 a 9 imagens de referência, refere-se a cada uma delas no prompt como personagem1, personagem2, personagem3... na ordem em que aparecem, e o modelo funde esses assuntos em um único vídeo coerente, preservando a identidade, a cor, os materiais e a composição.
Em vez de escolher entre a liberdade de texto para vídeo e a fidelidade de imagem para vídeo, o modelo permite reunir um elenco – um personagem, uma roupa, um adereço, um acessório – em um único prompt e direcioná-los com linguagem natural. Alimentado por um transformador unificado de 15 parâmetros B com destilação DMD-2, o modelo oferece saída de 1080p em velocidade competitiva sem sacrificar a fidelidade facial, os detalhes da roupa ou a continuidade da cena.
Formato de saída: vídeo/nível de resolução: 720P ou 1080P/duração: 3–15 segundos/proporção: 16:9, 9:16, 1:1, 4:3, 3:4/imagens de referência: 1–9 por geração
| Parâmetro | Obrigatório | Tipo | Padrão | Gama / Opções | Descrição |
|---|---|---|---|---|---|
| imagem_url_1* | Sim | corda | — | JPEG, JPG, PNG, WEBP | Primeira imagem de referência, marcada como character1 no prompt. |
| imagem_url_2… imagem_url_9 | Não | corda | — | JPEG, JPG, PNG, WEBP | Imagens de referência adicionais opcionais, marcadas como personagem2… personagem9. |
| alerta* | Sim | corda | — | máximo de 2.500 caracteres chineses/5.000 caracteres não chineses | Cena, movimento, câmera, iluminação; use character1/character2/… para fazer referência a cada imagem. |
| proporção_de_aspecto | Não | corda | 16:9 | 16:9, 9:16, 1:1, 4:3, 3:4 | Proporção de aspecto de saída. |
| resolução | Não | corda | 1080P | 720P, 1080P | Camada de resolução de vídeo de saída. |
| duração | Não | inteiro | 5 | 3–15 | Duração do vídeo de saída em segundos. |
| semente | Não | inteiro | 0 | 0 a 2147483647 | Semente aleatória opcional. Use 0 para permitir que o provedor escolha um automaticamente. |
| marca d'água | Não | booleano | falso | verdadeiro, falso | Se deve incluir a marca d'água do provedor no vídeo gerado. |
Transforme fotos em clipes de movimento cinematográficos com controle de câmera e áudio.
Modelo de vídeo realista com IA para curtas com direção estética
Melhore e restaure vídeos rapidamente com IA de alta qualidade.
Vídeos curtos com personagens e cenários coerentes e animados
Vídeos realistas com controle criativo total em estrutura e estilo.
Controle de câmera, templates prontos e narrativa visual com qualidade de cinema
HappyHorse 1.0 Reference to Video é o modo multiimagem assunto para vídeo do HappyHorse 1.0 – o modelo de vídeo nº 1 classificado na Arena (Elo 1392). Ele aceita de 1 a 9 imagens de referência, além de um prompt de texto que marca cada sujeito como personagem1, personagem2, personagem3… e, em seguida, os funde em um único clipe 720P/1080P coerente com identidade, roupa e fidelidade de acessórios estáveis.
A conversão de texto em vídeo começa apenas com palavras; imagem para vídeo anima um quadro de origem; reference-to-video traz vários assuntos (uma pessoa, uma fantasia, um acessório, um adereço) na mesma geração e permite direcioná-los com um único prompt. Ele combina a liberdade da solicitação de texto com a força de bloqueio de identidade das imagens de referência.
A ordem de referência é fixada pela posição de upload. A imagem 1 é o personagem1, a imagem 2 é o personagem2, a imagem 3 é o personagem3 e assim por diante até o personagem9. No seu prompt, você escreve algo como “personagem1 vestindo personagem2, segurando personagem3, andando por um corredor iluminado pelo sol” – o modelo vincula cada tag à imagem de referência correspondente.
O modelo produz clipes nativos de 720P ou 1080P com durações selecionáveis de 3 a 15 segundos, em proporções de 16:9, 9:16, 1:1, 4:3 e 3:4. A qualidade da saída é adequada para entrega de anúncios e publicação social sem reavaliação.
Cada imagem de referência deve ser JPEG, JPG, PNG ou WEBP, com um lado curto de pelo menos 400 pixels (720P ou superior recomendado) e um tamanho de arquivo inferior a 10 MB, servido a partir de um URL HTTP/HTTPS público. Evite fontes borradas, muito compactadas ou com marca d’água – referências nítidas e bem iluminadas dão ao modelo a melhor chance de bloquear a identidade.
Ancore cada tag de personagem em uma frase e, em seguida, descreva o movimento e a linguagem da câmera: deriva, movimentar-se, orbitar, inclinar para cima, empurrar, revelar. Indique o que deve permanecer bloqueado (rosto, roupa, embalagem), adicione evolução de iluminação para uma sensação cinematográfica e mantenha cada clipe em uma batida visual clara. Reutilize a mesma semente ao comparar variantes de prompt ou de referência.
O modelo é ideal para narrativa de vários personagens, experimentação virtual com trocas de acessórios, vídeos de personagem + roupa + acessórios, montagem de ativos de marca, transições de embalagem para apresentação e teasers de anúncios cinematográficos onde você já tem um elenco de ativos de referência e precisa que eles se movam juntos com uma identidade estável.
RunComfy é a principal ComfyUI plataforma, oferecendo ComfyUI online ambiente e serviços, juntamente com fluxos de trabalho do ComfyUI apresentando visuais impressionantes. RunComfy também oferece AI Models, permitindo que artistas utilizem as mais recentes ferramentas de AI para criar arte incrível.





