Transformez vos images en vidéos réalistes grâce à la puissance de l'IA Veo 3.1.
Kling 3.0 Standard Image to Video est le modèle d'animation d'image IA prêt pour la production de Kuaishou qui transforme une seule image fixe en un court clip cinématographique de 3 à 15 secondes, avec un son natif en option, des rythmes de scène à invites multiples et des éléments de référence pour une cohérence d'identité. Il s'agit du niveau le plus rentable de la famille Kling 3.0, à 0,084 USD par seconde sans audio ou 0,126 USD par seconde avec audio.
| Attribut | Valeur |
|---|---|
| Résolution de sortie | Jusqu'à 1080p (typique) |
| Fréquence d'images | 24 à 60 ips (variable) |
| Durée | 3 à 15 secondes |
| Rapports d'aspect | 16:9, 9:16, 1:1 |
| Audio | Audio natif en option |
| Contrôle d'identité | Image frontale + URL de référence + vidéo de référence facultative |
| Tarifs | 0,084 $/s sans audio · 0,126 $/s avec audio |
| Formats d'entrée | jpg, jpeg, png, bmp, webp |
Les contrôles d'entrée exposés pour Kling 3.0 Standard Image to Video sur RunComfy :
| Paramètre | Obligatoire | Tapez | Par défaut | Gamme / Options | Descriptif |
|---|---|---|---|---|---|
| invite | Non | chaîne | "" | — | Guidage textuel pour le mouvement, le style et la direction de la caméra. |
| multi_prompt | Non | tableau | — | 0 à 20 articles | Segments d'invite supplémentaires conduisant à la progression de la scène ; la durée des segments doit correspondre à la durée totale de la vidéo. |
| multi_prompt[].prompt | Non | chaîne | — | — | Texte pour un seul segment de la séquence. |
| multi_prompt[].durée | Non | entier | 5 | 3 à 15 (secondes) | Durée du segment en secondes. |
| start_image_url* | Oui (*) | chaîne | — | URL | Image fixe principale à animer. |
| durée | Non | entier | 12 | 3 à 15 (secondes) | Longueur totale du clip de sortie. |
| générer_audio | Non | booléen | vrai | vrai / faux | Activez la génération audio native pour le clip. |
| éléments | Non | tableau | — | — | Actifs facultatifs pour stabiliser l’identité/le style d’une prise de vue à l’autre. |
| éléments[].frontal_image_url | Non | chaîne | — | URL | Image de référence frontale pour l’identité du sujet. |
| éléments[].reference_image_urls | Non | tableau | — | URL | Références d’angle/style supplémentaires pour le sujet. |
| éléments[].video_url | Non | chaîne | — | URL | Courte vidéo de référence pour guider le mouvement/l’identité. |
| type_de-coup | Non | chaîne | personnaliser | — | Mode de contrôle de tir ; personnaliser permet un mouvement sur mesure. |
| invite_négative | Non | chaîne | flou, distorsion et mauvaise qualité | — | Termes pour décourager les artefacts ou styles indésirables. |
| cfg_scale | Non | numéro | 0,5 | — | Intensité du guidage ; Une valeur inférieure favorise le mouvement naturel, une valeur supérieure renforce l'invite plus fortement. |
Kling 3.0 Standard Image to Video est facturé par seconde rendue sur RunComfy :
| Mode | Tarif |
|---|---|
| Sans son | 0,084 $ par seconde |
| Avec son | 0,126 $ par seconde |
Un clip de 5 secondes coûte 0,42 $ en mode silencieux ou 0,63 $ avec audio. Un clip de 15 secondes coûte 1,26 $ ou 1,89 $. L'activation de l'audio applique un supplément de 1,5 ×.
Transformez vos images en vidéos réalistes grâce à la puissance de l'IA Veo 3.1.
HappyHorse 1.0 avec sortie native 1080p, mouvement cinématographique et cohérence multi-plans.
Animez vos images fixes en vidéos fluides et dynamiques en un clic.
Transformez vos images en vidéos fluides et réalistes grâce à l'IA.
Création vidéo rapide et fluide avec contrôle total du rendu visuel
Créez des vidéos HD à partir de texte avec Kling 2.1, simple et puissant.
Kling 3.0 Standard Image to Video peut générer des vidéos jusqu'à une résolution de 1080p et prend généralement en charge des durées allant jusqu'à 15 secondes par clip. Dans certains paramètres améliorés ou Pro/Omni, les utilisateurs peuvent atteindre jusqu'à 4K à 60 ips. Pour les tâches standard de conversion d'image en vidéo, le respect de ces limites permet de maintenir la stabilité de la sortie et d'éviter les artefacts temporels.
Oui. Kling 3.0 Standard Image to Video permet une image de référence principale en mode Standard, tandis que le mode Omni prend en charge plusieurs images de référence ou même de courtes vidéos pour une apparence cohérente des personnages. L’utilisation d’un nombre de références supérieur au nombre de références pris en charge peut entraîner une troncature rapide ou un mouvement incohérent dans les sorties image vers vidéo.
Pour passer du test de Kling 3.0 Standard Image to Video dans RunComfy Playground à la production, les développeurs doivent d'abord confirmer le comportement stable des prompts et des paramètres, puis obtenir une clé API depuis leur tableau de bord RunComfy. L'API reflète les mêmes endpoints que le playground, ce qui permet la génération automatisée image vers vidéo via des requêtes POST avec entrées média et texte. Assurez-vous d'avoir suffisamment de crédits USD et envisagez le traitement par lots pour les charges plus importantes.
Par rapport à la version 2.6, Kling 3.0 Standard Image to Video offre une profondeur, une parallaxe et une stabilité de mouvement considérablement améliorées dans le rendu image vers vidéo. Il modélise le mouvement naturel de la caméra et les changements de lumière dynamiques avec moins de distorsions visuelles, grâce à l'attention spatio-temporelle dans son cadre Omni One.
Kling 3.0 Standard Image to Video se distingue par sa fidélité de mouvement plus élevée et sa limite de 15 secondes plus longue, gérant les sorties 1080p à 4K et les mouvements sensibles à la physique. Alors que Seedance propose un son de synchronisation labiale très précis, Kling propose un cadre image-vidéo plus intégré combinant réalisme de l'éclairage, ancrage de référence et contrôle de la caméra narrative.
Oui. Kling 3.0 Standard Image to Video inclut la génération audio native alignée sur le mouvement produit. Il peut synthétiser le son ambiant, les dialogues ou les effets directement pendant la création d'image en vidéo, bien que les scénarios multi-haut-parleurs avancés puissent nécessiter un affinement en post-production.
Kling 3.0 Standard Image to Video utilise l'ancrage d'image de référence pour garantir la stabilité de l'identité lors de la génération d'image en vidéo. Le modèle sous-jacent suit la cohérence structurelle et des couleurs sur chaque image, minimisant le scintillement et la dérive, même dans les scènes à mouvement élevé.
Les sorties image vers vidéo standard Kling 3.0 peuvent être utilisées commercialement si votre utilisation est conforme à la licence Kling AI d'origine. Les développeurs doivent vérifier les termes avant la redistribution. Pour les pipelines professionnels, la solution s'intègre parfaitement à l'API de RunComfy pour les flux de travail automatisés d'image à vidéo et le rendu par lots.
Kling 3.0 Standard Image to Video accepte les fichiers image standard (JPG, PNG, WEBP) et les invites de texte facultatives. Il peut également traiter des métadonnées supplémentaires telles que les angles de caméra ou les préférences d'éclairage pour guider la génération de scènes image-vidéo.
Kling 3.0 Standard Image to Video excelle dans l'animation de portraits, de présentations de produits et de courts teasers cinématographiques où les transitions fluides entre l'image et la vidéo sont importantes. Ses atouts incluent un mouvement sensible à la physique et une haute fidélité de scène, ce qui le rend idéal pour les clips de marketing numérique, la narration sur les réseaux sociaux et la prévisualisation VFX.
RunComfy est la première ComfyUI plateforme, offrant des ComfyUI en ligne environnement et services, ainsi que des workflows ComfyUI proposant des visuels époustouflants. RunComfy propose également AI Models, permettant aux artistes d'utiliser les derniers outils d'IA pour créer des œuvres d'art incroyables.





