logo
RunComfy
  • ComfyUI
  • TreinadorNovo
  • Modelos
  • API
  • Preços
discord logo
MODELOS
Explorar
Todos os modelos
BIBLIOTECA
Gerações
APIS DE MODELOS
Documentação da API
Chaves API
CONTA
Uso

Imagem para vídeo padrão Kling 3.0: imagem para vídeo com movimento físico no playground e API | Models and API | RunComfy

kling/kling-3.0/standard/image-to-video

Anime imagens estáticas em vídeos de alta fidelidade com movimento sensível à física, controle de câmera e áudio nativo para uma narrativa visual rápida, cinematográfica e pronta para a marca.

Fornece vários segmentos de prompt para transições de cena. A soma de todas as durações dos segmentos deve ser igual à duração total do vídeo.
Imagem inicial do vídeo. Suporta formatos jpg, jpeg, png, bmp, webp.
Duração total do vídeo gerado em segundos.
Habilite esta opção para gerar áudio para o vídeo.
Ativos de entrada usados ​​para geração, incluindo imagens de referência e segmentos de vídeo.
Define como a tomada da câmera ou o enquadramento da cena são tratados.
Escala de orientação sem classificador que controla a adesão ao prompt.
Idle
The rate is $0.084 per second without audio, and $0.126 per second with audio.

Introdução à imagem padrão do Kling 3.0 para vídeo

O Kling 3.0 da Kling AI anima imagens estáticas em vídeo de alta fidelidade a US$ 0,084 por segundo sem áudio ou US$ 0,126 por segundo com áudio, gerando clipes de até 15 segundos com movimento com reconhecimento de física e áudio nativo. Trocando quadros-chave manuais quadro a quadro e composição de vários aplicativos para movimento ancorado em referência, controle de câmera e geração de áudio nativo, o Kling 3.0 Standard Image to Video agiliza a produção, eliminando mascaramento complexo, pós-upscaling e correções tediosas de sincronização labial, criado para equipes de comércio eletrônico, profissionais de marketing criativos e líderes de produção de mídia. Para desenvolvedores, o Kling 3.0 Standard Image to Video no RunComfy pode ser usado tanto no navegador quanto por meio de uma API HTTP, para que você não precise hospedar ou dimensionar o modelo sozinho.
Ideal para: anúncios em vídeo de alta conversão | Animações de produtos consistentes com a marca | Storyboarding cinematográfico e Previz

Kling 3.0 imagem padrão para vídeo#


Kling 3.0 Standard Image to Video é o modelo de animação de imagem de IA pronto para produção da Kuaishou que transforma uma única imagem estática em um clipe cinematográfico curto de 3 a 15 segundos, com áudio nativo opcional, batidas de cena com vários prompts e elementos de referência para consistência de identidade. É o nível mais econômico da família Kling 3.0, custando US$ 0,084 por segundo sem áudio ou US$ 0,126 por segundo com áudio.


Especificações principais#


AtributoValor
Resolução de saídaAté 1080p (típico)
Taxa de quadros24–60 fps (varia)
Duração3–15 segundos
Proporções16:9, 9:16, 1:1
ÁudioÁudio nativo opcional
Controle de identidadeImagem frontal + URLs de referência + vídeo de referência opcional
PreçosUS$ 0,084/seg sem áudio · US$ 0,126/seg com áudio
Formatos de entradajpg, jpeg, png, bmp, webp

Parâmetros#


Os controles de entrada expostos para Kling 3.0 Standard Image to Video no RunComfy:


ParâmetroObrigatórioTipoPadrãoGama / OpçõesDescrição
alertaNãocorda""—Orientação de texto para movimento, estilo e direção da câmera.
multi_promptNãomatriz—0–20 itensSegmentos de alerta adicionais impulsionando a progressão da cena; as durações dos segmentos devem ser somadas à duração total do vídeo.
multi_prompt[].promptNãocorda——Texto para um único segmento na sequência.
multi_prompt[].duraçãoNãointeiro53–15 (segundos)Duração do segmento em segundos.
start_image_url*Sim (*)corda—URLA principal imagem estática a ser animada.
duraçãoNãointeiro123–15 (segundos)Comprimento total do clipe de saída.
gerar_áudioNãobooleanoverdadeverdadeiro/falsoAtive a geração de áudio nativo para o clipe.
elementosNãomatriz——Ativos opcionais para estabilizar a identidade/estilo nas fotos.
elementos[].frontal_image_urlNãocorda—URLImagem de referência frontal para identidade do sujeito.
elementos[].reference_image_urlsNãomatriz—URLReferências adicionais de ângulo/estilo para o assunto.
elementos[].video_urlNãocorda—URLPequeno vídeo de referência para orientar o movimento/identidade.
tipo_de_tiroNãocordapersonalizar—Modo de controle de tiro; personalizar permite movimentos personalizados.
prompt_negativoNãocordadesfoque, distorção e baixa qualidade—Termos para desencorajar artefatos ou estilos indesejados.
escala_cfgNãonúmero0,5—Intensidade de orientação; o mais baixo favorece o movimento natural, o mais alto reforça o prompt com mais força.

Preços#


Kling 3.0 Standard Image to Video é cobrado por segundo renderizado no RunComfy:


ModoTaxa
Sem áudioUS$ 0,084 por segundo
Com áudioUS$ 0,126 por segundo

Um clipe de 5 segundos custa US$ 0,42 silencioso ou US$ 0,63 com áudio. Um clipe de 15 segundos custa US$ 1,26 ou US$ 1,89. A ativação do áudio aplica uma sobretaxa de 1,5×.

Modelos Relacionados

kling-1-6/pro/text-to-video

Crie vídeos de alta qualidade a partir de textos com o Kling 1.6 Pro.

sora-2/pro/image-to-video

Transforme imagens em vídeos realistas com Sora 2 Pro com áudio sincronizado.

Hailuo Video 01 Director

Controle de câmera, templates prontos e narrativa visual com qualidade de cinema

runway-aleph/video-to-video

Edite vídeos com estilo, controle de luz e geração por texto

kling-3.0/pro/text-to-video

Texto para vídeo cinematográfico premium com a mais alta fidelidade visual da família Kling V3.0.

kling-2-1/master/image-to-video

Transforme imagens e textos em vídeos HD com movimento realista.

Perguntas Frequentes

Qual é a resolução e duração máximas suportadas pelo Kling 3.0 Standard Image to Video para geração de imagem para vídeo?

Kling 3.0 Standard Image to Video pode gerar vídeos com resolução de até 1080p e normalmente suporta durações de até 15 segundos por clipe. Em algumas configurações aprimoradas ou Pro/Omni, os usuários podem alcançar até 4K a 60fps. Para tarefas padrão de imagem para vídeo, permanecer dentro desses limites ajuda a manter a estabilidade da saída e evita artefatos temporais.

O Kling 3.0 Standard Image to Video tem limites nas entradas de referência para animação de imagem para vídeo?

Sim. Kling 3.0 Standard Image to Video permite uma imagem de referência primária no modo Padrão, enquanto o modo Omni suporta múltiplas imagens de referência ou até mesmo vídeos curtos para uma aparência consistente dos personagens. Usar mais do que a contagem de referência suportada pode causar truncamento imediato ou movimento inconsistente nas saídas de imagem para vídeo.

Como faço a transição do RunComfy Playground para a API para uso em produção do Kling 3.0 Standard Image to Video?

Para passar do teste de imagem padrão do Kling 3.0 para vídeo no RunComfy Playground para produção, os desenvolvedores devem primeiro confirmar o comportamento estável do prompt e dos parâmetros e, em seguida, adquirir uma chave de API em seu painel RunComfy. A API espelha os endpoints do playground, permitindo a geração automatizada de imagem para vídeo enviando solicitações POST com entradas de mídia e texto. Garanta créditos em dólares adequados e considere o envio em lote para cargas de trabalho maiores.

Como o Kling 3.0 Standard Image to Video difere das versões anteriores em termos de realismo de movimento de imagem para vídeo?

Comparado com a versão 2.6, o Kling 3.0 Standard Image to Video oferece profundidade, paralaxe e estabilidade de movimento significativamente melhoradas na renderização de imagem para vídeo. Ele modela o movimento natural da câmera e mudanças dinâmicas de luz com menos distorções visuais, graças à atenção espaço-temporal sob sua estrutura Omni One.

O que faz o Kling 3.0 Standard Image to Video se destacar de concorrentes como Seedance 1.0 Pro ou Wan 2.5?

Kling 3.0 Standard Image to Video se destaca por sua maior fidelidade de movimento e limite mais longo de 15 segundos, lidando com saídas de 1080p a 4K e movimento com reconhecimento de física. Embora o Seedance tenha áudio com sincronização labial muito preciso, o Kling oferece uma estrutura de imagem para vídeo mais integrada, combinando realismo de iluminação, ancoragem de referência e controle narrativo da câmera.

O Kling 3.0 Standard Image to Video pode gerar áudio sincronizado para cenas de imagem para vídeo?

Sim. Kling 3.0 Standard Image to Video inclui geração de áudio nativo alinhado com o movimento produzido. Ele pode sintetizar som ambiente, diálogo ou efeitos diretamente durante a criação de imagem para vídeo, embora cenários avançados com vários alto-falantes possam exigir refinamento na pós-produção.

Como o Kling 3.0 Standard Image to Video mantém a consistência do assunto nos quadros gerados?

Kling 3.0 Standard Image to Video usa ancoragem de imagem de referência para garantir a estabilidade da identidade durante a geração de imagem para vídeo. O modelo subjacente rastreia a consistência estrutural e de cores em cada quadro, minimizando oscilações e desvios mesmo em cenas com muito movimento.

O Kling 3.0 Standard Image to Video é adequado para uso comercial e pipelines de produção?

As saídas de imagem para vídeo padrão do Kling 3.0 podem ser usadas comercialmente se seu uso estiver em conformidade com a licença original do Kling AI. Os desenvolvedores devem verificar os termos antes da redistribuição. Para pipelines profissionais, a solução integra-se perfeitamente à API RunComfy para fluxos de trabalho automatizados de imagem para vídeo e renderização em lote.

Quais formatos de entrada são suportados pelo Kling 3.0 Standard Image to Video ao realizar a criação de imagem para vídeo?

Kling 3.0 Standard Image to Video aceita arquivos de imagem padrão (JPG, PNG, WEBP) e prompts de texto opcionais. Ele também pode processar metadados adicionais, como ângulos de câmera ou preferências de iluminação, para orientar a geração de cena de imagem para vídeo.

Quais são os melhores casos de uso do Kling 3.0 Standard Image to Video na produção criativa?

Kling 3.0 Standard Image to Video é excelente na animação de retratos, vitrines de produtos e pequenos teasers cinematográficos, onde transições suaves de imagem para vídeo são importantes. Seus pontos fortes incluem movimento com reconhecimento de física e alta fidelidade de cena, tornando-o ideal para clipes de marketing digital, narração de histórias em mídias sociais e pré-visualização de efeitos visuais.

Siga-nos
  • LinkedIn
  • Facebook
  • Instagram
  • Twitter
Suporte
  • Discord
  • E-mail
  • Status do Sistema
  • afiliado
Modelos de Vídeo
  • Wan 2.6 Flash
  • Kling Video O3 Pro Image To Video
  • Wan 2.6
  • Seedance 2.0 Fast
  • Hailuo 2.3 Fast Standard
  • Kling 3.0
  • Ver todos os modelos →
Modelos de Imagem
  • seedream 4.0
  • Nano Banana 2 Edit
  • Flux 2 Dev
  • Nano Banana Pro
  • GPT Image 2 Image Edit
  • FLUX.1 Schnell
  • Ver todos os modelos →
Legal
  • Termos de Serviço
  • Política de Privacidade
  • Política de Cookies
RunComfy
Copyright 2026 RunComfy. Todos os Direitos Reservados.

RunComfy é a principal ComfyUI plataforma, oferecendo ComfyUI online ambiente e serviços, juntamente com fluxos de trabalho do ComfyUI apresentando visuais impressionantes. RunComfy também oferece AI Models, permitindo que artistas utilizem as mais recentes ferramentas de AI para criar arte incrível.

Exemplos de imagem padrão para vídeo do Kling 3.0

Video thumbnail
Loading...
Video thumbnail
Loading...
Video thumbnail
Loading...
Video thumbnail
Loading...
Video thumbnail
Loading...
Video thumbnail
Loading...