Verwandle mit Kling 2.1 Bilder in realistische, fließende Videos.
Kling 3.0 Standard Image to Video ist Kuaishous produktionsbereites KI-Bildanimationsmodell, das ein einzelnes Standbild in einen kurzen filmischen Clip von 3–15 Sekunden verwandelt, mit optionalem nativem Audio, Szenenbeats mit mehreren Eingabeaufforderungen und Referenzelementen für Identitätskonsistenz. Mit 0,084 US-Dollar pro Sekunde ohne Audio oder 0,126 US-Dollar pro Sekunde mit Audio ist es die kostengünstigste Stufe der Kling 3.0-Familie.
| Attribut | Wert |
|---|---|
| Ausgabeauflösung | Bis zu 1080p (typisch) |
| Bildrate | 24–60 fps (variiert) |
| Dauer | 3–15 Sekunden |
| Seitenverhältnisse | 16:9, 9:16, 1:1 |
| Audio | Optionales natives Audio |
| Identitätskontrolle | Frontalbild + Referenz-URLs + optionales Referenzvideo |
| Preise | 0,084 $/Sek. ohne Audio · 0,126 $/Sek. mit Audio |
| Eingabeformate | jpg, jpeg, png, bmp, webp |
Die für Kling 3.0 Standard Image to Video auf RunComfy bereitgestellten Eingabesteuerelemente:
| Parameter | Erforderlich | Geben Sie | ein Standard | Sortiment / Optionen | Beschreibung |
|---|---|---|---|---|---|
| Eingabeaufforderung | Nein | Zeichenfolge | "" | — | Textanweisungen für Bewegung, Stil und Kamerarichtung. |
| multi_prompt | Nein | Array | — | 0–20 Artikel | Zusätzliche Aufforderungssegmente, die den Szenenfortschritt vorantreiben; Die Segmentdauer muss sich zur gesamten Videodauer summieren. |
| multi_prompt[].prompt | Nein | Zeichenfolge | — | — | Text für ein einzelnes Segment in der Sequenz. |
| multi_prompt[].duration | Nein | Ganzzahl | 5 | 3–15 (Sekunden) | Dauer des Segments in Sekunden. |
| start_image_url* | Ja (*) | Zeichenfolge | — | URL | Das primäre Standbild, das animiert werden soll. |
| Dauer | Nein | Ganzzahl | 12 | 3–15 (Sekunden) | Gesamtlänge des Ausgabeclips. |
| generieren_audio | Nein | boolescher Wert | wahr | wahr / falsch | Aktivieren Sie die native Audiogenerierung für den Clip. |
| Elemente | Nein | Array | — | — | Optionale Assets zur Stabilisierung von Identität/Stil über mehrere Aufnahmen hinweg. |
| elements[].frontal_image_url | Nein | Zeichenfolge | — | URL | Frontales Referenzbild zur Subjektidentität. |
| elements[].reference_image_urls | Nein | Array | — | URLs | Zusätzliche Blickwinkel-/Stilreferenzen für das Thema. |
| elements[].video_url | Nein | Zeichenfolge | — | URL | Kurzes Referenzvideo zur Anleitung von Bewegung/Identität. |
| Schusstyp | Nein | Zeichenfolge | anpassen | — | Schusskontrollmodus; „Anpassen“ ermöglicht maßgeschneiderte Bewegungen. |
| negative_prompt | Nein | Zeichenfolge | Unschärfe, Verzerrung und geringe Qualität | — | Begriffe, um unerwünschte Artefakte oder Stile zu verhindern. |
| cfg_scale | Nein | Nummer | 0,5 | — | Führungsintensität; Ein niedrigerer Wert begünstigt die natürliche Bewegung, ein höherer Wert verstärkt die Aufforderung stärker. |
Kling 3.0 Standard Image to Video wird pro gerenderter Sekunde auf RunComfy abgerechnet:
| Modus | Bewerten |
|---|---|
| Ohne Ton | 0,084 $ pro Sekunde |
| Mit Audio | 0,126 $ pro Sekunde |
Ein 5-Sekunden-Clip kostet 0,42 US-Dollar ohne Ton oder 0,63 US-Dollar mit Ton. Ein 15-Sekunden-Clip kostet 1,26 $ oder 1,89 $. Für die Aktivierung von Audio fällt ein 1,5-facher Aufpreis an.
Verwandle mit Kling 2.1 Bilder in realistische, fließende Videos.
KI-gestützte Bildanimationen in 1080p mit präziser Kontrolle und Effekten
Filmische Szenen gestalten mit Textbefehlen und Lichtsteuerung
Füge mühelos Personen oder Objekte in bestehende Videos ein.
Erzeuge kinoreife Videoclips mit präziser Steuerung und natürlichem Sound
Erstelle beeindruckende Videos aus Text mit Kling 2.5 Turbo – schnell, kreativ und gestochen scharf.
Kling 3.0 Standard Image to Video kann Videos mit einer Auflösung von bis zu 1080p generieren und unterstützt normalerweise eine Dauer von bis zu 15 Sekunden pro Clip. In einigen erweiterten oder Pro/Omni-Einstellungen können Benutzer bis zu 4K bei 60 Bildern pro Sekunde erreichen. Bei standardmäßigen Bild-zu-Video-Aufgaben trägt die Einhaltung dieser Grenzen dazu bei, die Ausgabestabilität aufrechtzuerhalten und zeitliche Artefakte zu vermeiden.
Ja. Kling 3.0 Standard Image to Video ermöglicht ein primäres Referenzbild im Standardmodus, während der Omni-Modus mehrere Referenzbilder oder sogar kurze Videos für ein einheitliches Erscheinungsbild der Charaktere unterstützt. Die Verwendung von mehr als der unterstützten Referenzanzahl kann zu sofortigem Abschneiden oder inkonsistenter Bewegung bei Bild-zu-Video-Ausgaben führen.
Um vom Testen von Kling 3.0 Standard Image to Video im RunComfy Playground zur Produktion überzugehen, sollten Entwickler zunächst ein stabiles Eingabeaufforderungs- und Parameterverhalten bestätigen und dann einen API-Schlüssel von ihrem RunComfy Dashboard erwerben. Die API spiegelt die Playground-Endpunkte wider und ermöglicht die automatisierte Bild-zu-Video-Generierung durch Senden von POST-Anfragen mit Medien- und Texteingaben. Stellen Sie sicher, dass ausreichend USD-Guthaben vorhanden ist, und erwägen Sie bei größeren Arbeitslasten die Stapelverarbeitung.
Im Vergleich zu Version 2.6 bietet Kling 3.0 Standard Image to Video eine deutlich verbesserte Tiefe, Parallaxe und Bewegungsstabilität beim Bild-zu-Video-Rendering. Es modelliert natürliche Kamerabewegungen und dynamische Lichtverschiebungen mit weniger visuellen Verzerrungen, dank der raumzeitlichen Aufmerksamkeit im Rahmen seines Omni One-Frameworks.
Kling 3.0 Standard Image to Video zeichnet sich durch eine höhere Bewegungstreue und eine längere 15-Sekunden-Grenze aus und verarbeitet 1080p- bis 4K-Ausgaben und physikbewusste Bewegungen. Während Seedance über sehr präzises lippensynchrones Audio verfügt, bietet Kling ein stärker integriertes Bild-zu-Video-Framework, das Beleuchtungsrealismus, Referenzverankerung und narrative Kamerasteuerung kombiniert.
Ja. Kling 3.0 Standard Image to Video umfasst eine native Audioerzeugung, die auf die produzierte Bewegung abgestimmt ist. Es kann Umgebungsgeräusche, Dialoge oder Effekte direkt während der Bild-zu-Video-Erstellung synthetisieren, obwohl fortgeschrittene Szenarien mit mehreren Lautsprechern möglicherweise eine Verfeinerung in der Nachbearbeitung erfordern.
Kling 3.0 Standard Image to Video verwendet Referenzbildverankerung, um Identitätsstabilität während der Bild-zu-Video-Generierung sicherzustellen. Das zugrunde liegende Modell verfolgt die Struktur- und Farbkonsistenz in jedem Bild und minimiert so Flimmern und Drift selbst in Szenen mit hoher Bewegung.
Kling 3.0 Standard-Bild-zu-Video-Ausgänge können kommerziell genutzt werden, wenn Ihre Nutzung der ursprünglichen Kling AI-Lizenz entspricht. Entwickler sollten die Bedingungen vor der Weiterverbreitung überprüfen. Für professionelle Pipelines lässt sich die Lösung reibungslos in die RunComfy-API integrieren, um automatisierte Bild-zu-Video-Workflows und Batch-Rendering zu ermöglichen.
Kling 3.0 Standard Image to Video akzeptiert Standardbilddateien (JPG, PNG, WEBP) und optionale Textaufforderungen. Es kann auch zusätzliche Metadaten wie Kamerawinkel oder Beleuchtungseinstellungen verarbeiten, um die Bild-zu-Video-Szenengenerierung zu steuern.
Kling 3.0 Standard Image to Video eignet sich hervorragend für die Animation von Porträts, Produktpräsentationen und kurzen Kino-Teasern, bei denen es auf reibungslose Bild-Video-Übergänge ankommt. Zu seinen Stärken gehören physikbewusste Bewegungen und hohe Szenentreue, wodurch es sich ideal für digitale Marketingclips, Social-Media-Storytelling und VFX-Vorvisualisierung eignet.
RunComfy ist die führende ComfyUI Plattform, die ComfyUI online Umgebung und Services bietet, zusammen mit ComfyUI Workflows mit atemberaubenden Visualisierungen. RunComfy bietet auch AI Models, Künstlern ermöglichen, die neuesten AI-Tools zu nutzen, um unglaubliche Kunst zu schaffen.





