logo
RunComfy
  • ComfyUI
  • TreinadorNovo
  • Modelos
  • API
  • Preços
discord logo
MODELOS
Explorar
Todos os modelos
BIBLIOTECA
Gerações
APIS DE MODELOS
Documentação da API
Chaves API
CONTA
Uso

HappyHorse 1.0 Referência ao vídeo: Modelo de IA de assunto para vídeo com múltiplas imagens | Models and API | RunComfy

happyhorse/happyhorse-1.0/reference-to-video

HappyHorse 1.0 Reference to Video funde até 9 imagens de referência com um prompt de texto para gerar clipes 720P/1080P de 3 a 15s no RunComfy – bloqueie personagens, roupas e adereços com tags character1/character2.

Primeira imagem de referência. Marque este assunto no prompt como personagem1. Formato: JPEG, JPG, PNG ou WEBP. Lado curto ≥ 400px, recomendado 720P ou superior, máximo de 10MB.
Segunda imagem de referência opcional. Marque este assunto no prompt como personagem2. Formato: JPEG, JPG, PNG ou WEBP. Deixe em branco para pular.
Terceira imagem de referência opcional. Marque este assunto no prompt como personagem3. Formato: JPEG, JPG, PNG ou WEBP. Deixe em branco para pular.
Quarta imagem de referência opcional. Marque este assunto no prompt como personagem4. Deixe em branco para pular.
Quinta imagem de referência opcional. Marque este assunto no prompt como personagem5. Deixe em branco para pular.
Sexta imagem de referência opcional. Marque este assunto no prompt como personagem6. Deixe em branco para pular.
Sétima imagem de referência opcional. Marque este assunto no prompt como personagem7. Deixe em branco para pular.
Oitava imagem de referência opcional. Marque este assunto no prompt como personagem8. Deixe em branco para pular.
Nona imagem de referência opcional. Marque este assunto no prompt como personagem9. Deixe em branco para pular.
Descreva a cena, o movimento, a câmera e a iluminação. Consulte cada imagem de referência com caractere1, caracter2, caracter3… na ordem em que aparecem acima. Máximo de 2.500 caracteres chineses/5.000 caracteres não chineses.
Proporção de aspecto de vídeo de saída.
Resolução de vídeo de saída. O modelo suporta 720P ou 1080P.
Duração do vídeo de saída em segundos. Valores permitidos: 3–15.
Semente opcional para gerações reproduzíveis. Use 0 para permitir que o provedor seja aleatório.
Idle
$0.15 per second for 720P and $0.28 per second for 1080P.

Introdução ao HappyHorse 1.0 Referência ao vídeo

HappyHorse 1.0 Reference to Video já está disponível no RunComfy através do Alibaba. Carregue de 1 a 9 imagens de referência, escreva um prompt que marque cada sujeito como personagem1, personagem2, personagem3…, e o modelo as compõe em um único clipe coerente com identidade, figurino e fidelidade de adereços estáveis. Construído no Transformer unificado HappyHorse 1.0 número 1 da Arena (Elo 1392), ele mantém rostos, roupas e acessórios visualmente bloqueados enquanto adiciona movimento cinematográfico em 720P ou 1080P.
Ideal para: narrativa com vários personagens | teste virtual com trocas de adereços | vídeos de personagem + roupa + acessórios | montagem de ativos de marca | teasers de anúncios cinematográficos

HappyHorse 1.0 R2V no X: notícias e atualizações

HappyHorse 1.0 R2V no YouTube: demonstrações e análises

YouTube preview
YouTube preview

HappyHorse 1.0 Referência ao vídeo#


Este modelo no RunComfy usa a API de síntese de vídeo assíncrona do Alibaba com o modelo happyhorse-1.0-r2v. Você carrega de 1 a 9 imagens de referência, refere-se a cada uma delas no prompt como personagem1, personagem2, personagem3... na ordem em que aparecem, e o modelo funde esses assuntos em um único vídeo coerente, preservando a identidade, a cor, os materiais e a composição.


Em vez de escolher entre a liberdade de texto para vídeo e a fidelidade de imagem para vídeo, o modelo permite reunir um elenco – um personagem, uma roupa, um adereço, um acessório – em um único prompt e direcioná-los com linguagem natural. Alimentado por um transformador unificado de 15 parâmetros B com destilação DMD-2, o modelo oferece saída de 1080p em velocidade competitiva sem sacrificar a fidelidade facial, os detalhes da roupa ou a continuidade da cena.


Formato de saída: vídeo/nível de resolução: 720P ou 1080P/duração: 3–15 segundos/proporção: 16:9, 9:16, 1:1, 4:3, 3:4/imagens de referência: 1–9 por geração


Parâmetros#


ParâmetroObrigatórioTipoPadrãoGama / OpçõesDescrição
imagem_url_1*Simcorda—JPEG, JPG, PNG, WEBPPrimeira imagem de referência, marcada como character1 no prompt.
imagem_url_2… imagem_url_9Nãocorda—JPEG, JPG, PNG, WEBPImagens de referência adicionais opcionais, marcadas como personagem2… personagem9.
alerta*Simcorda—máximo de 2.500 caracteres chineses/5.000 caracteres não chinesesCena, movimento, câmera, iluminação; use character1/character2/… para fazer referência a cada imagem.
proporção_de_aspectoNãocorda16:916:9, 9:16, 1:1, 4:3, 3:4Proporção de aspecto de saída.
resoluçãoNãocorda1080P720P, 1080PCamada de resolução de vídeo de saída.
duraçãoNãointeiro53–15Duração do vídeo de saída em segundos.
sementeNãointeiro00 a 2147483647Semente aleatória opcional. Use 0 para permitir que o provedor escolha um automaticamente.
marca d'águaNãobooleanofalsoverdadeiro, falsoSe deve incluir a marca d'água do provedor no vídeo gerado.

Como usar#


  1. Carregue a imagem de referência 1 – geralmente o personagem principal – e adicione mais 8 para roupas, adereços ou personagens coadjuvantes.
  2. No prompt, faça referência a cada upload por sua posição: caractere1 = imagem 1, caracter2 = imagem 2 e assim por diante.
  3. Descreva o movimento, o movimento da câmera, a evolução da iluminação e a batida visual desejada.
  4. Escolha a proporção, 720P ou 1080P e uma duração entre 3 e 15 segundos.
  5. Opcionalmente, corrija a semente para comparações repetíveis.
  6. Envie e baixe o clipe finalizado.

Dicas imediatas#


  • Ancore cada personagem pelo nome em uma frase: "personagem1 vestindo personagem2, segurando personagem3, andando por um corredor iluminado pelo sol."
  • Lidere com verbos de movimento e câmera - deriva, movimenta-se, orbita, inclina para cima, empurra, revela.
  • Especifique o que deve ficar bloqueado: rosto, roupa, embalagem, colocação do logotipo.
  • Adicione evolução de iluminação (sol se movendo no rosto, néon piscando) para resultados cinematográficos.
  • Mantenha cada clipe em uma batida visual clara; o modelo renderiza fotos de intenção única de maneira mais limpa.
  • Use imagens de referência nítidas e bem iluminadas ≥720P; evite assuntos muito comprimidos ou cortados.
  • Reutilize a mesma semente ao comparar variantes de prompt ou de referência.

Requisitos de imagem#


  • Formato: JPEG, JPG, PNG ou WEBP.
  • Lado curto ≥ 400px, 720P ou superior recomendado.
  • Tamanho do arquivo ≤ 10MB por imagem.
  • URL pública HTTP/HTTPS; evite imagens de origem borradas, supercomprimidas ou com marca d’água.

Notas#


  • Este modelo é referência para vídeo; para animação de imagem única, use o modelo HappyHorse 1.0 I2V e, para geração somente de prompt, use o modelo de texto para vídeo HappyHorse 1.0.
  • A duração fora de 3 a 15 segundos não é exposta neste modelo.
  • URLs de vídeo gerados retornados pelo provedor são válidos por 24 horas; baixe ou hospede novamente imediatamente.

Modelos Relacionados

kling-3.0/standard/image-to-video

Transforme fotos em clipes de movimento cinematográficos com controle de câmera e áudio.

SkyReels V1

Modelo de vídeo realista com IA para curtas com direção estética

seedvr2/upscale/video

Melhore e restaure vídeos rapidamente com IA de alta qualidade.

runway-gen-4/turbo/image-to-video

Vídeos curtos com personagens e cenários coerentes e animados

runway-gen-3-alpha/turbo/image-to-video

Vídeos realistas com controle criativo total em estrutura e estilo.

Hailuo Video 01 Director

Controle de câmera, templates prontos e narrativa visual com qualidade de cinema

Perguntas Frequentes

O que é a referência do HappyHorse 1.0 ao vídeo?

HappyHorse 1.0 Reference to Video é o modo multiimagem assunto para vídeo do HappyHorse 1.0 – o modelo de vídeo nº 1 classificado na Arena (Elo 1392). Ele aceita de 1 a 9 imagens de referência, além de um prompt de texto que marca cada sujeito como personagem1, personagem2, personagem3… e, em seguida, os funde em um único clipe 720P/1080P coerente com identidade, roupa e fidelidade de acessórios estáveis.

Qual a diferença entre texto para vídeo e imagem para vídeo?

A conversão de texto em vídeo começa apenas com palavras; imagem para vídeo anima um quadro de origem; reference-to-video traz vários assuntos (uma pessoa, uma fantasia, um acessório, um adereço) na mesma geração e permite direcioná-los com um único prompt. Ele combina a liberdade da solicitação de texto com a força de bloqueio de identidade das imagens de referência.

Como faço referência a cada imagem no prompt?

A ordem de referência é fixada pela posição de upload. A imagem 1 é o personagem1, a imagem 2 é o personagem2, a imagem 3 é o personagem3 e assim por diante até o personagem9. No seu prompt, você escreve algo como “personagem1 vestindo personagem2, segurando personagem3, andando por um corredor iluminado pelo sol” – o modelo vincula cada tag à imagem de referência correspondente.

Qual resolução e duração o modelo produz?

O modelo produz clipes nativos de 720P ou 1080P com durações selecionáveis ​​de 3 a 15 segundos, em proporções de 16:9, 9:16, 1:1, 4:3 e 3:4. A qualidade da saída é adequada para entrega de anúncios e publicação social sem reavaliação.

Quais são os requisitos para imagens de referência?

Cada imagem de referência deve ser JPEG, JPG, PNG ou WEBP, com um lado curto de pelo menos 400 pixels (720P ou superior recomendado) e um tamanho de arquivo inferior a 10 MB, servido a partir de um URL HTTP/HTTPS público. Evite fontes borradas, muito compactadas ou com marca d’água – referências nítidas e bem iluminadas dão ao modelo a melhor chance de bloquear a identidade.

Que tipo de prompt funciona melhor?

Ancore cada tag de personagem em uma frase e, em seguida, descreva o movimento e a linguagem da câmera: deriva, movimentar-se, orbitar, inclinar para cima, empurrar, revelar. Indique o que deve permanecer bloqueado (rosto, roupa, embalagem), adicione evolução de iluminação para uma sensação cinematográfica e mantenha cada clipe em uma batida visual clara. Reutilize a mesma semente ao comparar variantes de prompt ou de referência.

Quais são os casos de uso típicos?

O modelo é ideal para narrativa de vários personagens, experimentação virtual com trocas de acessórios, vídeos de personagem + roupa + acessórios, montagem de ativos de marca, transições de embalagem para apresentação e teasers de anúncios cinematográficos onde você já tem um elenco de ativos de referência e precisa que eles se movam juntos com uma identidade estável.

Siga-nos
  • LinkedIn
  • Facebook
  • Instagram
  • Twitter
Suporte
  • Discord
  • E-mail
  • Status do Sistema
  • afiliado
Modelos de Vídeo
  • Wan 2.6 Flash
  • Hailuo 2.3 Fast Standard
  • Wan 2.6
  • Wan 2.7 Reference to Video
  • Seedance 2.0 Fast
  • Seedance 2.0 Pro
  • Ver todos os modelos →
Modelos de Imagem
  • seedream 4.0
  • Flux 2 Dev
  • Nano Banana 2 Edit
  • Nano Banana Pro
  • Qwen Image Edit 2511 LoRA
  • Nano Banana 2
  • Ver todos os modelos →
Legal
  • Termos de Serviço
  • Política de Privacidade
  • Política de Cookies
RunComfy
Copyright 2026 RunComfy. Todos os Direitos Reservados.

RunComfy é a principal ComfyUI plataforma, oferecendo ComfyUI online ambiente e serviços, juntamente com fluxos de trabalho do ComfyUI apresentando visuais impressionantes. RunComfy também oferece AI Models, permitindo que artistas utilizem as mais recentes ferramentas de AI para criar arte incrível.

Exemplos de criações HappyHorse 1.0 R2V

Video thumbnail
Loading...
Video thumbnail
Loading...
Video thumbnail
Loading...
Video thumbnail
Loading...
Video thumbnail
Loading...
Video thumbnail
Loading...