HappyHorse 1.0 Referência ao vídeo: Modelo de IA de assunto para vídeo com múltiplas imagens | Models and API

happyhorse/happyhorse-1.0/reference-to-video

HappyHorse 1.0 Reference to Video funde até 9 imagens de referência com um prompt de texto para gerar clipes 720P/1080P de 3 a 15s no RunComfy – bloqueie personagens, roupas e adereços com tags character1/character2.

Imagem de referência 1 (personagem1) *

Primeira imagem de referência. Marque este assunto no prompt como personagem1. Formato: JPEG, JPG, PNG ou WEBP. Lado curto ≥ 400px, recomendado 720P ou superior, máximo de 10MB.

Imagem de referência 2 (personagem2)

Segunda imagem de referência opcional. Marque este assunto no prompt como personagem2. Formato: JPEG, JPG, PNG ou WEBP. Deixe em branco para pular.

Imagem de referência 3 (personagem3)

Terceira imagem de referência opcional. Marque este assunto no prompt como personagem3. Formato: JPEG, JPG, PNG ou WEBP. Deixe em branco para pular.

Imagem de referência 4 (personagem4)

Quarta imagem de referência opcional. Marque este assunto no prompt como personagem4. Deixe em branco para pular.

Imagem de referência 5 (personagem5)

Quinta imagem de referência opcional. Marque este assunto no prompt como personagem5. Deixe em branco para pular.

Imagem de referência 6 (personagem6)

Sexta imagem de referência opcional. Marque este assunto no prompt como personagem6. Deixe em branco para pular.

Imagem de referência 7 (personagem7)

Sétima imagem de referência opcional. Marque este assunto no prompt como personagem7. Deixe em branco para pular.

Imagem de referência 8 (personagem8)

Oitava imagem de referência opcional. Marque este assunto no prompt como personagem8. Deixe em branco para pular.

Imagem de referência 9 (personagem9)

Nona imagem de referência opcional. Marque este assunto no prompt como personagem9. Deixe em branco para pular.

Prompt *

Descreva a cena, o movimento, a câmera e a iluminação. Consulte cada imagem de referência com caractere1, caracter2, caracter3… na ordem em que aparecem acima. Máximo de 2.500 caracteres chineses/5.000 caracteres não chineses.

Proporção de aspecto (W:H)

Proporção de aspecto de vídeo de saída.

Resolução

Resolução de vídeo de saída. O modelo suporta 720P ou 1080P.

Duração

Duração do vídeo de saída em segundos. Valores permitidos: 3–15.

Semente

Semente opcional para gerações reproduzíveis. Use 0 para permitir que o provedor seja aleatório.

Idle

$0.15 per second for 720P and $0.28 per second for 1080P.

Introdução ao HappyHorse 1.0 Referência ao vídeo

HappyHorse 1.0 Reference to Video já está disponível no RunComfy através do Alibaba. Carregue de 1 a 9 imagens de referência, escreva um prompt que marque cada sujeito como personagem1, personagem2, personagem3…, e o modelo as compõe em um único clipe coerente com identidade, figurino e fidelidade de adereços estáveis. Construído no Transformer unificado HappyHorse 1.0 número 1 da Arena (Elo 1392), ele mantém rostos, roupas e acessórios visualmente bloqueados enquanto adiciona movimento cinematográfico em 720P ou 1080P.
Ideal para: narrativa com vários personagens | teste virtual com trocas de adereços | vídeos de personagem + roupa + acessórios | montagem de ativos de marca | teasers de anúncios cinematográficos

HappyHorse 1.0 R2V no X: notícias e atualizações

HappyHorse 1.0 R2V no YouTube: demonstrações e análises

HappyHorse 1.0 Referência ao vídeo#

Este modelo no RunComfy usa a API de síntese de vídeo assíncrona do Alibaba com o modelo happyhorse-1.0-r2v. Você carrega de 1 a 9 imagens de referência, refere-se a cada uma delas no prompt como personagem1, personagem2, personagem3... na ordem em que aparecem, e o modelo funde esses assuntos em um único vídeo coerente, preservando a identidade, a cor, os materiais e a composição.

Em vez de escolher entre a liberdade de texto para vídeo e a fidelidade de imagem para vídeo, o modelo permite reunir um elenco – um personagem, uma roupa, um adereço, um acessório – em um único prompt e direcioná-los com linguagem natural. Alimentado por um transformador unificado de 15 parâmetros B com destilação DMD-2, o modelo oferece saída de 1080p em velocidade competitiva sem sacrificar a fidelidade facial, os detalhes da roupa ou a continuidade da cena.

Formato de saída: vídeo/nível de resolução: 720P ou 1080P/duração: 3–15 segundos/proporção: 16:9, 9:16, 1:1, 4:3, 3:4/imagens de referência: 1–9 por geração

Parâmetros#

Parâmetro	Obrigatório	Tipo	Padrão	Gama / Opções	Descrição
imagem_url_1*	Sim	corda	—	JPEG, JPG, PNG, WEBP	Primeira imagem de referência, marcada como character1 no prompt.
imagem_url_2… imagem_url_9	Não	corda	—	JPEG, JPG, PNG, WEBP	Imagens de referência adicionais opcionais, marcadas como personagem2… personagem9.
alerta*	Sim	corda	—	máximo de 2.500 caracteres chineses/5.000 caracteres não chineses	Cena, movimento, câmera, iluminação; use character1/character2/… para fazer referência a cada imagem.
proporção_de_aspecto	Não	corda	16:9	16:9, 9:16, 1:1, 4:3, 3:4	Proporção de aspecto de saída.
resolução	Não	corda	1080P	720P, 1080P	Camada de resolução de vídeo de saída.
duração	Não	inteiro	5	3–15	Duração do vídeo de saída em segundos.
semente	Não	inteiro	0	0 a 2147483647	Semente aleatória opcional. Use 0 para permitir que o provedor escolha um automaticamente.
marca d'água	Não	booleano	falso	verdadeiro, falso	Se deve incluir a marca d'água do provedor no vídeo gerado.

Como usar#

Carregue a imagem de referência 1 – geralmente o personagem principal – e adicione mais 8 para roupas, adereços ou personagens coadjuvantes.
No prompt, faça referência a cada upload por sua posição: caractere1 = imagem 1, caracter2 = imagem 2 e assim por diante.
Descreva o movimento, o movimento da câmera, a evolução da iluminação e a batida visual desejada.
Escolha a proporção, 720P ou 1080P e uma duração entre 3 e 15 segundos.
Opcionalmente, corrija a semente para comparações repetíveis.
Envie e baixe o clipe finalizado.

Dicas imediatas#

Ancore cada personagem pelo nome em uma frase: "personagem1 vestindo personagem2, segurando personagem3, andando por um corredor iluminado pelo sol."
Lidere com verbos de movimento e câmera - deriva, movimenta-se, orbita, inclina para cima, empurra, revela.
Especifique o que deve ficar bloqueado: rosto, roupa, embalagem, colocação do logotipo.
Adicione evolução de iluminação (sol se movendo no rosto, néon piscando) para resultados cinematográficos.
Mantenha cada clipe em uma batida visual clara; o modelo renderiza fotos de intenção única de maneira mais limpa.
Use imagens de referência nítidas e bem iluminadas ≥720P; evite assuntos muito comprimidos ou cortados.
Reutilize a mesma semente ao comparar variantes de prompt ou de referência.

Requisitos de imagem#

Formato: JPEG, JPG, PNG ou WEBP.
Lado curto ≥ 400px, 720P ou superior recomendado.
Tamanho do arquivo ≤ 10MB por imagem.
URL pública HTTP/HTTPS; evite imagens de origem borradas, supercomprimidas ou com marca d’água.

Notas#

Este modelo é referência para vídeo; para animação de imagem única, use o modelo HappyHorse 1.0 I2V e, para geração somente de prompt, use o modelo de texto para vídeo HappyHorse 1.0.
A duração fora de 3 a 15 segundos não é exposta neste modelo.
URLs de vídeo gerados retornados pelo provedor são válidos por 24 horas; baixe ou hospede novamente imediatamente.

Modelos Relacionados

wan-2-2/speech-to-video

Anime uma imagem de uma trilha de áudio no modo de fala, canto ou performance.

ltx-2/retake-video

Modifique um trecho específico de um vídeo por prompt e substitua o áudio, a imagem ou ambos.

wan-2.7/text-to-video

Crie clipes em 1080p com múltiplas referências e controle de quadros.

gemini-omni-flash/reference-to-video

Crie um vídeo curto com áudio sincronizado a partir de imagens de referência e um prompt.

kling/lipsync/text-to-video

Gere voz a partir de texto e sincronize-a com um vídeo; escolha voz, idioma e velocidade.

wan-2-2/fun-camera

Anime uma imagem necessária a partir de um prompt necessário. Controle o tamanho da saída, a contagem de quadros, a taxa de reprodução, a intensidade do movimento da câmera, a semente, as etapas, a orientação e o deslocamento.

Perguntas Frequentes

O que é a referência do HappyHorse 1.0 ao vídeo?

HappyHorse 1.0 Reference to Video é o modo multiimagem assunto para vídeo do HappyHorse 1.0 – o modelo de vídeo nº 1 classificado na Arena (Elo 1392). Ele aceita de 1 a 9 imagens de referência, além de um prompt de texto que marca cada sujeito como personagem1, personagem2, personagem3… e, em seguida, os funde em um único clipe 720P/1080P coerente com identidade, roupa e fidelidade de acessórios estáveis.

Qual a diferença entre texto para vídeo e imagem para vídeo?

A conversão de texto em vídeo começa apenas com palavras; imagem para vídeo anima um quadro de origem; reference-to-video traz vários assuntos (uma pessoa, uma fantasia, um acessório, um adereço) na mesma geração e permite direcioná-los com um único prompt. Ele combina a liberdade da solicitação de texto com a força de bloqueio de identidade das imagens de referência.

Como faço referência a cada imagem no prompt?

A ordem de referência é fixada pela posição de upload. A imagem 1 é o personagem1, a imagem 2 é o personagem2, a imagem 3 é o personagem3 e assim por diante até o personagem9. No seu prompt, você escreve algo como “personagem1 vestindo personagem2, segurando personagem3, andando por um corredor iluminado pelo sol” – o modelo vincula cada tag à imagem de referência correspondente.

Qual resolução e duração o modelo produz?

O modelo produz clipes nativos de 720P ou 1080P com durações selecionáveis de 3 a 15 segundos, em proporções de 16:9, 9:16, 1:1, 4:3 e 3:4. A qualidade da saída é adequada para entrega de anúncios e publicação social sem reavaliação.

Quais são os requisitos para imagens de referência?

Cada imagem de referência deve ser JPEG, JPG, PNG ou WEBP, com um lado curto de pelo menos 400 pixels (720P ou superior recomendado) e um tamanho de arquivo inferior a 10 MB, servido a partir de um URL HTTP/HTTPS público. Evite fontes borradas, muito compactadas ou com marca d’água – referências nítidas e bem iluminadas dão ao modelo a melhor chance de bloquear a identidade.

Que tipo de prompt funciona melhor?

Ancore cada tag de personagem em uma frase e, em seguida, descreva o movimento e a linguagem da câmera: deriva, movimentar-se, orbitar, inclinar para cima, empurrar, revelar. Indique o que deve permanecer bloqueado (rosto, roupa, embalagem), adicione evolução de iluminação para uma sensação cinematográfica e mantenha cada clipe em uma batida visual clara. Reutilize a mesma semente ao comparar variantes de prompt ou de referência.

Quais são os casos de uso típicos?

O modelo é ideal para narrativa de vários personagens, experimentação virtual com trocas de acessórios, vídeos de personagem + roupa + acessórios, montagem de ativos de marca, transições de embalagem para apresentação e teasers de anúncios cinematográficos onde você já tem um elenco de ativos de referência e precisa que eles se movam juntos com uma identidade estável.

RunComfy

RunComfy é a principal ComfyUI plataforma, oferecendo ComfyUI online ambiente e serviços, juntamente com fluxos de trabalho do ComfyUI apresentando visuais impressionantes. RunComfy também oferece AI Models, permitindo que artistas utilizem as mais recentes ferramentas de AI para criar arte incrível.

HappyHorse 1.0 Reference to Video funde até 9 imagens de referência com um prompt de texto para gerar clipes 720P/1080P de 3 a 15s no RunComfy – bloqueie personagens, roupas e adereços com tags character1/character2.

Introdução ao HappyHorse 1.0 Referência ao vídeo

HappyHorse 1.0 R2V no X: notícias e atualizações

HappyHorse 1.0 R2V no YouTube: demonstrações e análises

HappyHorse 1.0 Referência ao vídeo#

Parâmetros#

Como usar#

Dicas imediatas#

Requisitos de imagem#

Notas#

Modelos Relacionados

Perguntas Frequentes

O que é a referência do HappyHorse 1.0 ao vídeo?

Qual a diferença entre texto para vídeo e imagem para vídeo?

Como faço referência a cada imagem no prompt?

Qual resolução e duração o modelo produz?

Quais são os requisitos para imagens de referência?

Que tipo de prompt funciona melhor?

Quais são os casos de uso típicos?

HappyHorse 1.0 Reference to Video funde até 9 imagens de referência com um prompt de texto para gerar clipes 720P/1080P de 3 a 15s no RunComfy – bloqueie personagens, roupas e adereços com tags character1/character2.

Introdução ao HappyHorse 1.0 Referência ao vídeo

Exemplos de criações HappyHorse 1.0 R2V

HappyHorse 1.0 R2V no X: notícias e atualizações

HappyHorse 1.0 R2V no YouTube: demonstrações e análises

HappyHorse 1.0 Referência ao vídeo#

Parâmetros#

Como usar#

Dicas imediatas#

Requisitos de imagem#

Notas#

Modelos Relacionados

Perguntas Frequentes

O que é a referência do HappyHorse 1.0 ao vídeo?

Qual a diferença entre texto para vídeo e imagem para vídeo?

Como faço referência a cada imagem no prompt?

Qual resolução e duração o modelo produz?

Quais são os requisitos para imagens de referência?

Que tipo de prompt funciona melhor?

Quais são os casos de uso típicos?

Exemplos de criações HappyHorse 1.0 R2V

HappyHorse 1.0 Referência ao vídeo: Modelo de IA de assunto para vídeo com múltiplas imagens | Models and API | RunComfy

HappyHorse 1.0 Reference to Video funde até 9 imagens de referência com um prompt de texto para gerar clipes 720P/1080P de 3 a 15s no RunComfy – bloqueie personagens, roupas e adereços com tags character1/character2.

Introdução ao HappyHorse 1.0 Referência ao vídeo

HappyHorse 1.0 R2V no X: notícias e atualizações

HappyHorse 1.0 R2V no YouTube: demonstrações e análises

HappyHorse 1.0 Referência ao vídeo#

Parâmetros#

Como usar#

Dicas imediatas#

Requisitos de imagem#

Notas#

Modelos Relacionados

Perguntas Frequentes

O que é a referência do HappyHorse 1.0 ao vídeo?

Qual a diferença entre texto para vídeo e imagem para vídeo?

Como faço referência a cada imagem no prompt?

Qual resolução e duração o modelo produz?

Quais são os requisitos para imagens de referência?

Que tipo de prompt funciona melhor?

Quais são os casos de uso típicos?

HappyHorse 1.0 Referência ao vídeo: Modelo de IA de assunto para vídeo com múltiplas imagens | Models and API | RunComfy

HappyHorse 1.0 Reference to Video funde até 9 imagens de referência com um prompt de texto para gerar clipes 720P/1080P de 3 a 15s no RunComfy – bloqueie personagens, roupas e adereços com tags character1/character2.

Introdução ao HappyHorse 1.0 Referência ao vídeo

Exemplos de criações HappyHorse 1.0 R2V

HappyHorse 1.0 R2V no X: notícias e atualizações

HappyHorse 1.0 R2V no YouTube: demonstrações e análises

HappyHorse 1.0 Referência ao vídeo#

Parâmetros#

Como usar#

Dicas imediatas#

Requisitos de imagem#

Notas#

Modelos Relacionados

Perguntas Frequentes

O que é a referência do HappyHorse 1.0 ao vídeo?

Qual a diferença entre texto para vídeo e imagem para vídeo?

Como faço referência a cada imagem no prompt?

Qual resolução e duração o modelo produz?

Quais são os requisitos para imagens de referência?

Que tipo de prompt funciona melhor?

Quais são os casos de uso típicos?

Exemplos de criações HappyHorse 1.0 R2V