Imagem para vídeo padrão Kling 3.0: imagem para vídeo com movimento físico no playground e API | Models and API

kling/kling-3.0/standard/image-to-video

Anime imagens estáticas em vídeos de alta fidelidade com movimento sensível à física, controle de câmera e áudio nativo para uma narrativa visual rápida, cinematográfica e pronta para a marca.

Prompt *

Segmentos de vários prompts

Fornece vários segmentos de prompt para transições de cena. A soma de todas as durações dos segmentos deve ser igual à duração total do vídeo.

Imagem inicial *

Imagem inicial do vídeo. Suporta formatos jpg, jpeg, png, bmp, webp.

Duração

Duração total do vídeo gerado em segundos.

Gerar áudio

Habilite esta opção para gerar áudio para o vídeo.

Elementos

Ativos de entrada usados para geração, incluindo imagens de referência e segmentos de vídeo.

Tipo de tiro

Define como a tomada da câmera ou o enquadramento da cena são tratados.

Alerta negativo

Escala de Orientação

Escala de orientação sem classificador que controla a adesão ao prompt.

Idle

The rate is $0.084 per second without audio, and $0.126 per second with audio.

Introdução à imagem padrão do Kling 3.0 para vídeo

O Kling 3.0 da Kling AI anima imagens estáticas em vídeo de alta fidelidade a US$ 0,084 por segundo sem áudio ou US$ 0,126 por segundo com áudio, gerando clipes de até 15 segundos com movimento com reconhecimento de física e áudio nativo. Trocando quadros-chave manuais quadro a quadro e composição de vários aplicativos para movimento ancorado em referência, controle de câmera e geração de áudio nativo, o Kling 3.0 Standard Image to Video agiliza a produção, eliminando mascaramento complexo, pós-upscaling e correções tediosas de sincronização labial, criado para equipes de comércio eletrônico, profissionais de marketing criativos e líderes de produção de mídia. Para desenvolvedores, o Kling 3.0 Standard Image to Video no RunComfy pode ser usado tanto no navegador quanto por meio de uma API HTTP, para que você não precise hospedar ou dimensionar o modelo sozinho.
Ideal para: anúncios em vídeo de alta conversão | Animações de produtos consistentes com a marca | Storyboarding cinematográfico e Previz

Kling 3.0 imagem padrão para vídeo#

Kling 3.0 Standard Image to Video é o modelo de animação de imagem de IA pronto para produção da Kuaishou que transforma uma única imagem estática em um clipe cinematográfico curto de 3 a 15 segundos, com áudio nativo opcional, batidas de cena com vários prompts e elementos de referência para consistência de identidade. É o nível mais econômico da família Kling 3.0, custando US$ 0,084 por segundo sem áudio ou US$ 0,126 por segundo com áudio.

Especificações principais#

Atributo	Valor
Resolução de saída	Até 1080p (típico)
Taxa de quadros	24–60 fps (varia)
Duração	3–15 segundos
Proporções	16:9, 9:16, 1:1
Áudio	Áudio nativo opcional
Controle de identidade	Imagem frontal + URLs de referência + vídeo de referência opcional
Preços	US$ 0,084/seg sem áudio · US$ 0,126/seg com áudio
Formatos de entrada	jpg, jpeg, png, bmp, webp

Parâmetros#

Os controles de entrada expostos para Kling 3.0 Standard Image to Video no RunComfy:

Parâmetro	Obrigatório	Tipo	Padrão	Gama / Opções	Descrição
alerta	Não	corda	""	—	Orientação de texto para movimento, estilo e direção da câmera.
multi_prompt	Não	matriz	—	0–20 itens	Segmentos de alerta adicionais impulsionando a progressão da cena; as durações dos segmentos devem ser somadas à duração total do vídeo.
multi_prompt[].prompt	Não	corda	—	—	Texto para um único segmento na sequência.
multi_prompt[].duração	Não	inteiro	5	3–15 (segundos)	Duração do segmento em segundos.
start_image_url*	Sim (*)	corda	—	URL	A principal imagem estática a ser animada.
duração	Não	inteiro	12	3–15 (segundos)	Comprimento total do clipe de saída.
gerar_áudio	Não	booleano	verdade	verdadeiro/falso	Ative a geração de áudio nativo para o clipe.
elementos	Não	matriz	—	—	Ativos opcionais para estabilizar a identidade/estilo nas fotos.
elementos[].frontal_image_url	Não	corda	—	URL	Imagem de referência frontal para identidade do sujeito.
elementos[].reference_image_urls	Não	matriz	—	URL	Referências adicionais de ângulo/estilo para o assunto.
elementos[].video_url	Não	corda	—	URL	Pequeno vídeo de referência para orientar o movimento/identidade.
tipo_de_tiro	Não	corda	personalizar	—	Modo de controle de tiro; personalizar permite movimentos personalizados.
prompt_negativo	Não	corda	desfoque, distorção e baixa qualidade	—	Termos para desencorajar artefatos ou estilos indesejados.
escala_cfg	Não	número	0,5	—	Intensidade de orientação; o mais baixo favorece o movimento natural, o mais alto reforça o prompt com mais força.

Preços#

Kling 3.0 Standard Image to Video é cobrado por segundo renderizado no RunComfy:

Modo	Taxa
Sem áudio	US$ 0,084 por segundo
Com áudio	US$ 0,126 por segundo

Um clipe de 5 segundos custa US$ 0,42 silencioso ou US$ 0,63 com áudio. Um clipe de 15 segundos custa US$ 1,26 ou US$ 1,89. A ativação do áudio aplica uma sobretaxa de 1,5×.

Modelos Relacionados

kling-1-6/pro/text-to-video

Crie vídeos de alta qualidade a partir de textos com o Kling 1.6 Pro.

sora-2/pro/image-to-video

Transforme imagens em vídeos realistas com Sora 2 Pro com áudio sincronizado.

Hailuo Video 01 Director

Controle de câmera, templates prontos e narrativa visual com qualidade de cinema

runway-aleph/video-to-video

Edite vídeos com estilo, controle de luz e geração por texto

kling-3.0/pro/text-to-video

Texto para vídeo cinematográfico premium com a mais alta fidelidade visual da família Kling V3.0.

kling-2-1/master/image-to-video

Transforme imagens e textos em vídeos HD com movimento realista.

Perguntas Frequentes

Qual é a resolução e duração máximas suportadas pelo Kling 3.0 Standard Image to Video para geração de imagem para vídeo?

Kling 3.0 Standard Image to Video pode gerar vídeos com resolução de até 1080p e normalmente suporta durações de até 15 segundos por clipe. Em algumas configurações aprimoradas ou Pro/Omni, os usuários podem alcançar até 4K a 60fps. Para tarefas padrão de imagem para vídeo, permanecer dentro desses limites ajuda a manter a estabilidade da saída e evita artefatos temporais.

O Kling 3.0 Standard Image to Video tem limites nas entradas de referência para animação de imagem para vídeo?

Sim. Kling 3.0 Standard Image to Video permite uma imagem de referência primária no modo Padrão, enquanto o modo Omni suporta múltiplas imagens de referência ou até mesmo vídeos curtos para uma aparência consistente dos personagens. Usar mais do que a contagem de referência suportada pode causar truncamento imediato ou movimento inconsistente nas saídas de imagem para vídeo.

Como faço a transição do RunComfy Playground para a API para uso em produção do Kling 3.0 Standard Image to Video?

Para passar do teste de imagem padrão do Kling 3.0 para vídeo no RunComfy Playground para produção, os desenvolvedores devem primeiro confirmar o comportamento estável do prompt e dos parâmetros e, em seguida, adquirir uma chave de API em seu painel RunComfy. A API espelha os endpoints do playground, permitindo a geração automatizada de imagem para vídeo enviando solicitações POST com entradas de mídia e texto. Garanta créditos em dólares adequados e considere o envio em lote para cargas de trabalho maiores.

Como o Kling 3.0 Standard Image to Video difere das versões anteriores em termos de realismo de movimento de imagem para vídeo?

Comparado com a versão 2.6, o Kling 3.0 Standard Image to Video oferece profundidade, paralaxe e estabilidade de movimento significativamente melhoradas na renderização de imagem para vídeo. Ele modela o movimento natural da câmera e mudanças dinâmicas de luz com menos distorções visuais, graças à atenção espaço-temporal sob sua estrutura Omni One.

O que faz o Kling 3.0 Standard Image to Video se destacar de concorrentes como Seedance 1.0 Pro ou Wan 2.5?

Kling 3.0 Standard Image to Video se destaca por sua maior fidelidade de movimento e limite mais longo de 15 segundos, lidando com saídas de 1080p a 4K e movimento com reconhecimento de física. Embora o Seedance tenha áudio com sincronização labial muito preciso, o Kling oferece uma estrutura de imagem para vídeo mais integrada, combinando realismo de iluminação, ancoragem de referência e controle narrativo da câmera.

O Kling 3.0 Standard Image to Video pode gerar áudio sincronizado para cenas de imagem para vídeo?

Sim. Kling 3.0 Standard Image to Video inclui geração de áudio nativo alinhado com o movimento produzido. Ele pode sintetizar som ambiente, diálogo ou efeitos diretamente durante a criação de imagem para vídeo, embora cenários avançados com vários alto-falantes possam exigir refinamento na pós-produção.

Como o Kling 3.0 Standard Image to Video mantém a consistência do assunto nos quadros gerados?

Kling 3.0 Standard Image to Video usa ancoragem de imagem de referência para garantir a estabilidade da identidade durante a geração de imagem para vídeo. O modelo subjacente rastreia a consistência estrutural e de cores em cada quadro, minimizando oscilações e desvios mesmo em cenas com muito movimento.

O Kling 3.0 Standard Image to Video é adequado para uso comercial e pipelines de produção?

As saídas de imagem para vídeo padrão do Kling 3.0 podem ser usadas comercialmente se seu uso estiver em conformidade com a licença original do Kling AI. Os desenvolvedores devem verificar os termos antes da redistribuição. Para pipelines profissionais, a solução integra-se perfeitamente à API RunComfy para fluxos de trabalho automatizados de imagem para vídeo e renderização em lote.

Quais formatos de entrada são suportados pelo Kling 3.0 Standard Image to Video ao realizar a criação de imagem para vídeo?

Kling 3.0 Standard Image to Video aceita arquivos de imagem padrão (JPG, PNG, WEBP) e prompts de texto opcionais. Ele também pode processar metadados adicionais, como ângulos de câmera ou preferências de iluminação, para orientar a geração de cena de imagem para vídeo.

Quais são os melhores casos de uso do Kling 3.0 Standard Image to Video na produção criativa?

Kling 3.0 Standard Image to Video é excelente na animação de retratos, vitrines de produtos e pequenos teasers cinematográficos, onde transições suaves de imagem para vídeo são importantes. Seus pontos fortes incluem movimento com reconhecimento de física e alta fidelidade de cena, tornando-o ideal para clipes de marketing digital, narração de histórias em mídias sociais e pré-visualização de efeitos visuais.

RunComfy

RunComfy é a principal ComfyUI plataforma, oferecendo ComfyUI online ambiente e serviços, juntamente com fluxos de trabalho do ComfyUI apresentando visuais impressionantes. RunComfy também oferece AI Models, permitindo que artistas utilizem as mais recentes ferramentas de AI para criar arte incrível.

Anime imagens estáticas em vídeos de alta fidelidade com movimento sensível à física, controle de câmera e áudio nativo para uma narrativa visual rápida, cinematográfica e pronta para a marca.

Introdução à imagem padrão do Kling 3.0 para vídeo

Kling 3.0 imagem padrão para vídeo#

Especificações principais#

Parâmetros#

Preços#

Modelos Relacionados

Perguntas Frequentes

Qual é a resolução e duração máximas suportadas pelo Kling 3.0 Standard Image to Video para geração de imagem para vídeo?

O Kling 3.0 Standard Image to Video tem limites nas entradas de referência para animação de imagem para vídeo?

Como faço a transição do RunComfy Playground para a API para uso em produção do Kling 3.0 Standard Image to Video?

Como o Kling 3.0 Standard Image to Video difere das versões anteriores em termos de realismo de movimento de imagem para vídeo?

O que faz o Kling 3.0 Standard Image to Video se destacar de concorrentes como Seedance 1.0 Pro ou Wan 2.5?

O Kling 3.0 Standard Image to Video pode gerar áudio sincronizado para cenas de imagem para vídeo?

Como o Kling 3.0 Standard Image to Video mantém a consistência do assunto nos quadros gerados?

O Kling 3.0 Standard Image to Video é adequado para uso comercial e pipelines de produção?

Quais formatos de entrada são suportados pelo Kling 3.0 Standard Image to Video ao realizar a criação de imagem para vídeo?

Quais são os melhores casos de uso do Kling 3.0 Standard Image to Video na produção criativa?

Anime imagens estáticas em vídeos de alta fidelidade com movimento sensível à física, controle de câmera e áudio nativo para uma narrativa visual rápida, cinematográfica e pronta para a marca.

Introdução à imagem padrão do Kling 3.0 para vídeo

Exemplos de imagem padrão para vídeo do Kling 3.0

Kling 3.0 imagem padrão para vídeo#

Especificações principais#

Parâmetros#

Preços#

Modelos Relacionados

Perguntas Frequentes

Qual é a resolução e duração máximas suportadas pelo Kling 3.0 Standard Image to Video para geração de imagem para vídeo?

O Kling 3.0 Standard Image to Video tem limites nas entradas de referência para animação de imagem para vídeo?

Como faço a transição do RunComfy Playground para a API para uso em produção do Kling 3.0 Standard Image to Video?

Como o Kling 3.0 Standard Image to Video difere das versões anteriores em termos de realismo de movimento de imagem para vídeo?

O que faz o Kling 3.0 Standard Image to Video se destacar de concorrentes como Seedance 1.0 Pro ou Wan 2.5?

O Kling 3.0 Standard Image to Video pode gerar áudio sincronizado para cenas de imagem para vídeo?

Como o Kling 3.0 Standard Image to Video mantém a consistência do assunto nos quadros gerados?

O Kling 3.0 Standard Image to Video é adequado para uso comercial e pipelines de produção?

Quais formatos de entrada são suportados pelo Kling 3.0 Standard Image to Video ao realizar a criação de imagem para vídeo?

Quais são os melhores casos de uso do Kling 3.0 Standard Image to Video na produção criativa?

Exemplos de imagem padrão para vídeo do Kling 3.0

Imagem para vídeo padrão Kling 3.0: imagem para vídeo com movimento físico no playground e API | Models and API | RunComfy

Anime imagens estáticas em vídeos de alta fidelidade com movimento sensível à física, controle de câmera e áudio nativo para uma narrativa visual rápida, cinematográfica e pronta para a marca.

Introdução à imagem padrão do Kling 3.0 para vídeo

Kling 3.0 imagem padrão para vídeo#

Especificações principais#

Parâmetros#

Preços#

Modelos Relacionados

Perguntas Frequentes

Qual é a resolução e duração máximas suportadas pelo Kling 3.0 Standard Image to Video para geração de imagem para vídeo?

O Kling 3.0 Standard Image to Video tem limites nas entradas de referência para animação de imagem para vídeo?

Como faço a transição do RunComfy Playground para a API para uso em produção do Kling 3.0 Standard Image to Video?

Como o Kling 3.0 Standard Image to Video difere das versões anteriores em termos de realismo de movimento de imagem para vídeo?

O que faz o Kling 3.0 Standard Image to Video se destacar de concorrentes como Seedance 1.0 Pro ou Wan 2.5?

O Kling 3.0 Standard Image to Video pode gerar áudio sincronizado para cenas de imagem para vídeo?

Como o Kling 3.0 Standard Image to Video mantém a consistência do assunto nos quadros gerados?

O Kling 3.0 Standard Image to Video é adequado para uso comercial e pipelines de produção?

Quais formatos de entrada são suportados pelo Kling 3.0 Standard Image to Video ao realizar a criação de imagem para vídeo?

Quais são os melhores casos de uso do Kling 3.0 Standard Image to Video na produção criativa?

Imagem para vídeo padrão Kling 3.0: imagem para vídeo com movimento físico no playground e API | Models and API | RunComfy

Anime imagens estáticas em vídeos de alta fidelidade com movimento sensível à física, controle de câmera e áudio nativo para uma narrativa visual rápida, cinematográfica e pronta para a marca.

Introdução à imagem padrão do Kling 3.0 para vídeo

Exemplos de imagem padrão para vídeo do Kling 3.0

Kling 3.0 imagem padrão para vídeo#

Especificações principais#

Parâmetros#

Preços#

Modelos Relacionados

Perguntas Frequentes

Qual é a resolução e duração máximas suportadas pelo Kling 3.0 Standard Image to Video para geração de imagem para vídeo?

O Kling 3.0 Standard Image to Video tem limites nas entradas de referência para animação de imagem para vídeo?

Como faço a transição do RunComfy Playground para a API para uso em produção do Kling 3.0 Standard Image to Video?

Como o Kling 3.0 Standard Image to Video difere das versões anteriores em termos de realismo de movimento de imagem para vídeo?

O que faz o Kling 3.0 Standard Image to Video se destacar de concorrentes como Seedance 1.0 Pro ou Wan 2.5?

O Kling 3.0 Standard Image to Video pode gerar áudio sincronizado para cenas de imagem para vídeo?

Como o Kling 3.0 Standard Image to Video mantém a consistência do assunto nos quadros gerados?

O Kling 3.0 Standard Image to Video é adequado para uso comercial e pipelines de produção?

Quais formatos de entrada são suportados pelo Kling 3.0 Standard Image to Video ao realizar a criação de imagem para vídeo?

Quais são os melhores casos de uso do Kling 3.0 Standard Image to Video na produção criativa?

Exemplos de imagem padrão para vídeo do Kling 3.0