logo
RunComfy
  • ComfyUI
  • TrainerNew
  • Models
  • API
  • Pricing
discord logo
MODELS
Explore
All Models
LIBRARY
Generations
MODEL APIS
API Docs
API Keys
ACCOUNT
Usage

Imagem para vídeo padrão Kling 3.0: imagem para vídeo com movimento físico no playground e API | Models and API | RunComfy

kling/kling-3.0/standard/image-to-video

Anime imagens estáticas em vídeos de alta fidelidade com movimento sensível à física, controle de câmera e áudio nativo para uma narrativa visual rápida, cinematográfica e pronta para a marca.

Fornece vários segmentos de prompt para transições de cena. A soma de todas as durações dos segmentos deve ser igual à duração total do vídeo.
Imagem inicial do vídeo. Suporta formatos jpg, jpeg, png, bmp, webp.
Duração total do vídeo gerado em segundos.
Habilite esta opção para gerar áudio para o vídeo.
Ativos de entrada usados ​​para geração, incluindo imagens de referência e segmentos de vídeo.
Define como a tomada da câmera ou o enquadramento da cena são tratados.
Escala de orientação sem classificador que controla a adesão ao prompt.
Idle
The rate is $0.084 per second without audio, and $0.126 per second with audio.

Introdução à imagem padrão do Kling 3.0 para vídeo

O Kling 3.0 da Kling AI anima imagens estáticas em vídeo de alta fidelidade a US$ 0,084 por segundo sem áudio ou US$ 0,126 por segundo com áudio, gerando clipes de até 15 segundos com movimento com reconhecimento de física e áudio nativo. Trocando quadros-chave manuais quadro a quadro e composição de vários aplicativos para movimento ancorado em referência, controle de câmera e geração de áudio nativo, o Kling 3.0 Standard Image to Video agiliza a produção, eliminando mascaramento complexo, pós-upscaling e correções tediosas de sincronização labial, criado para equipes de comércio eletrônico, profissionais de marketing criativos e líderes de produção de mídia. Para desenvolvedores, o Kling 3.0 Standard Image to Video no RunComfy pode ser usado tanto no navegador quanto por meio de uma API HTTP, para que você não precise hospedar ou dimensionar o modelo sozinho.
Ideal para: anúncios em vídeo de alta conversão | Animações de produtos consistentes com a marca | Storyboarding cinematográfico e Previz

Kling 3.0 imagem padrão para vídeo#


Kling 3.0 Standard Image to Video é o modelo de animação de imagem de IA pronto para produção da Kuaishou que transforma uma única imagem estática em um clipe cinematográfico curto de 3 a 15 segundos, com áudio nativo opcional, batidas de cena com vários prompts e elementos de referência para consistência de identidade. É o nível mais econômico da família Kling 3.0, custando US$ 0,084 por segundo sem áudio ou US$ 0,126 por segundo com áudio.


Especificações principais#


AtributoValor
Resolução de saídaAté 1080p (típico)
Taxa de quadros24–60 fps (varia)
Duração3–15 segundos
Proporções16:9, 9:16, 1:1
ÁudioÁudio nativo opcional
Controle de identidadeImagem frontal + URLs de referência + vídeo de referência opcional
PreçosUS$ 0,084/seg sem áudio · US$ 0,126/seg com áudio
Formatos de entradajpg, jpeg, png, bmp, webp

Parâmetros#


Os controles de entrada expostos para Kling 3.0 Standard Image to Video no RunComfy:


ParâmetroObrigatórioTipoPadrãoGama / OpçõesDescrição
alertaNãocorda""—Orientação de texto para movimento, estilo e direção da câmera.
multi_promptNãomatriz—0–20 itensSegmentos de alerta adicionais impulsionando a progressão da cena; as durações dos segmentos devem ser somadas à duração total do vídeo.
multi_prompt[].promptNãocorda——Texto para um único segmento na sequência.
multi_prompt[].duraçãoNãointeiro53–15 (segundos)Duração do segmento em segundos.
start_image_url*Sim (*)corda—URLA principal imagem estática a ser animada.
duraçãoNãointeiro123–15 (segundos)Comprimento total do clipe de saída.
gerar_áudioNãobooleanoverdadeverdadeiro/falsoAtive a geração de áudio nativo para o clipe.
elementosNãomatriz——Ativos opcionais para estabilizar a identidade/estilo nas fotos.
elementos[].frontal_image_urlNãocorda—URLImagem de referência frontal para identidade do sujeito.
elementos[].reference_image_urlsNãomatriz—URLReferências adicionais de ângulo/estilo para o assunto.
elementos[].video_urlNãocorda—URLPequeno vídeo de referência para orientar o movimento/identidade.
tipo_de_tiroNãocordapersonalizar—Modo de controle de tiro; personalizar permite movimentos personalizados.
prompt_negativoNãocordadesfoque, distorção e baixa qualidade—Termos para desencorajar artefatos ou estilos indesejados.
escala_cfgNãonúmero0,5—Intensidade de orientação; o mais baixo favorece o movimento natural, o mais alto reforça o prompt com mais força.

Preços#


Kling 3.0 Standard Image to Video é cobrado por segundo renderizado no RunComfy:


ModoTaxa
Sem áudioUS$ 0,084 por segundo
Com áudioUS$ 0,126 por segundo

Um clipe de 5 segundos custa US$ 0,42 silencioso ou US$ 0,63 com áudio. Um clipe de 15 segundos custa US$ 1,26 ou US$ 1,89. A ativação do áudio aplica uma sobretaxa de 1,5×.

Modelos Relacionados

wan-2-1/fusionx/image-to-video

Crie vídeos cinematográficos com IA e controle preciso de imagem e texto

hunyuan/text-to-video

Transforme ideias em vídeos realistas e dinâmicos com Hunyuan Video da Tencent.

wan-2-5/text-to-video

Crie vídeos com áudio a partir de texto usando o Wan 2.5.

veo-3-1/first-last-frame-to-video

Transforme imagens em vídeos realistas com áudio e controle cinematográfico

veo-3/text-to-video

Transforme textos em vídeos criativos com áudio e controle de estilo usando o Google Veo 3.

pikaswaps

Troque partes de um vídeo com máscara, texto ou imagem de referência.

Frequently Asked Questions

Qual é a resolução e duração máximas suportadas pelo Kling 3.0 Standard Image to Video para geração de imagem para vídeo?

Kling 3.0 Standard Image to Video pode gerar vídeos com resolução de até 1080p e normalmente suporta durações de até 15 segundos por clipe. Em algumas configurações aprimoradas ou Pro/Omni, os usuários podem alcançar até 4K a 60fps. Para tarefas padrão de imagem para vídeo, permanecer dentro desses limites ajuda a manter a estabilidade da saída e evita artefatos temporais.

O Kling 3.0 Standard Image to Video tem limites nas entradas de referência para animação de imagem para vídeo?

Sim. Kling 3.0 Standard Image to Video permite uma imagem de referência primária no modo Padrão, enquanto o modo Omni suporta múltiplas imagens de referência ou até mesmo vídeos curtos para uma aparência consistente dos personagens. Usar mais do que a contagem de referência suportada pode causar truncamento imediato ou movimento inconsistente nas saídas de imagem para vídeo.

Como faço a transição do RunComfy Playground para a API para uso em produção do Kling 3.0 Standard Image to Video?

Para passar do teste de imagem padrão do Kling 3.0 para vídeo no RunComfy Playground para produção, os desenvolvedores devem primeiro confirmar o comportamento estável do prompt e dos parâmetros e, em seguida, adquirir uma chave de API em seu painel RunComfy. A API espelha os endpoints do playground, permitindo a geração automatizada de imagem para vídeo enviando solicitações POST com entradas de mídia e texto. Garanta créditos em dólares adequados e considere o envio em lote para cargas de trabalho maiores.

Como o Kling 3.0 Standard Image to Video difere das versões anteriores em termos de realismo de movimento de imagem para vídeo?

Comparado com a versão 2.6, o Kling 3.0 Standard Image to Video oferece profundidade, paralaxe e estabilidade de movimento significativamente melhoradas na renderização de imagem para vídeo. Ele modela o movimento natural da câmera e mudanças dinâmicas de luz com menos distorções visuais, graças à atenção espaço-temporal sob sua estrutura Omni One.

O que faz o Kling 3.0 Standard Image to Video se destacar de concorrentes como Seedance 1.0 Pro ou Wan 2.5?

Kling 3.0 Standard Image to Video se destaca por sua maior fidelidade de movimento e limite mais longo de 15 segundos, lidando com saídas de 1080p a 4K e movimento com reconhecimento de física. Embora o Seedance tenha áudio com sincronização labial muito preciso, o Kling oferece uma estrutura de imagem para vídeo mais integrada, combinando realismo de iluminação, ancoragem de referência e controle narrativo da câmera.

O Kling 3.0 Standard Image to Video pode gerar áudio sincronizado para cenas de imagem para vídeo?

Sim. Kling 3.0 Standard Image to Video inclui geração de áudio nativo alinhado com o movimento produzido. Ele pode sintetizar som ambiente, diálogo ou efeitos diretamente durante a criação de imagem para vídeo, embora cenários avançados com vários alto-falantes possam exigir refinamento na pós-produção.

Como o Kling 3.0 Standard Image to Video mantém a consistência do assunto nos quadros gerados?

Kling 3.0 Standard Image to Video usa ancoragem de imagem de referência para garantir a estabilidade da identidade durante a geração de imagem para vídeo. O modelo subjacente rastreia a consistência estrutural e de cores em cada quadro, minimizando oscilações e desvios mesmo em cenas com muito movimento.

O Kling 3.0 Standard Image to Video é adequado para uso comercial e pipelines de produção?

As saídas de imagem para vídeo padrão do Kling 3.0 podem ser usadas comercialmente se seu uso estiver em conformidade com a licença original do Kling AI. Os desenvolvedores devem verificar os termos antes da redistribuição. Para pipelines profissionais, a solução integra-se perfeitamente à API RunComfy para fluxos de trabalho automatizados de imagem para vídeo e renderização em lote.

Quais formatos de entrada são suportados pelo Kling 3.0 Standard Image to Video ao realizar a criação de imagem para vídeo?

Kling 3.0 Standard Image to Video aceita arquivos de imagem padrão (JPG, PNG, WEBP) e prompts de texto opcionais. Ele também pode processar metadados adicionais, como ângulos de câmera ou preferências de iluminação, para orientar a geração de cena de imagem para vídeo.

Quais são os melhores casos de uso do Kling 3.0 Standard Image to Video na produção criativa?

Kling 3.0 Standard Image to Video é excelente na animação de retratos, vitrines de produtos e pequenos teasers cinematográficos, onde transições suaves de imagem para vídeo são importantes. Seus pontos fortes incluem movimento com reconhecimento de física e alta fidelidade de cena, tornando-o ideal para clipes de marketing digital, narração de histórias em mídias sociais e pré-visualização de efeitos visuais.

Follow us
  • LinkedIn
  • Facebook
  • Instagram
  • Twitter
Support
  • Discord
  • Email
  • System Status
  • Affiliate
Video Models
  • Wan 2.6 Flash
  • Wan 2.7 Reference to Video
  • Seedance 1.0
  • Seedance 1.0 Pro Fast
  • Seedance 2.0 Pro
  • Hailuo 2.3 Fast Standard
  • View All Models →
Image Models
  • Ideogram V4
  • Wan 2.6 Image to Image
  • Nano Banana 2 Edit
  • Flux 2 Dev
  • Nano Banana Pro
  • Qwen Image Edit 2511 LoRA
  • View All Models →
Legal
  • Terms of Service
  • Privacy Policy
  • Cookie Policy
RunComfy
Copyright 2026 RunComfy. All Rights Reserved.

RunComfy is the premier ComfyUI platform, offering ComfyUI online environment and services, along with ComfyUI workflows featuring stunning visuals. RunComfy also provides AI Models, enabling artists to harness the latest AI tools to create incredible art.

Exemplos de imagem padrão para vídeo do Kling 3.0

Video thumbnail
Loading...
Video thumbnail
Loading...
Video thumbnail
Loading...
Video thumbnail
Loading...
Video thumbnail
Loading...
Video thumbnail
Loading...