logo
RunComfy
  • ComfyUI
  • 训练器新
  • 模型
  • API
  • 定价
discord logo
模型
探索
所有模型
资源库
生成记录
模型 API
API 文档
API 密钥
账户
使用情况

Kling 3.0 Standard Image to Video(标准图生视频):模型界面与 API 上的物理感知图生视频 | Models and API | RunComfy

kling/kling-3.0/standard/image-to-video

通过物理感知运动、摄像机控制和原生音频将静态图像动画化为高保真视频,以实现快速、电影般的品牌视觉故事讲述。

提供多个场景切换提示片段。所有片段持续时间的总和必须等于视频总持续时间。
视频的起始图像。支持 jpg、jpeg、png、bmp、webp 格式。
生成的视频的总持续时间(以秒为单位)。
启用此选项可为视频生成音频。
用于生成的输入资源,包括参考图像和视频片段。
定义如何处理相机镜头或场景取景。
无分类器指导尺度控制对提示的遵守。
Idle
The rate is $0.084 per second without audio, and $0.126 per second with audio.

Kling 3.0 Standard Image to Video(标准图生视频)简介

Kling AI 的 Kling 3.0 以每秒 0.084 美元(无音频)或每秒 0.126 美元(有音频)的速度将静态图像动画化为高保真视频,生成长达 15 秒的具有物理感知运动和原生音频的剪辑。 Kling 3.0 Standard Image to Video(标准图生视频)将手动逐帧关键帧和多应用程序合成替换为参考锚定运动、摄像机控制和原生音频生成,通过消除复杂的遮罩、后期放大和繁琐的口型同步修复来简化制作,专为电子商务团队、创意营销人员和媒体制作主管而构建。对于开发人员来说,RunComfy 上的 Kling 3.0 Standard Image to Video(标准图生视频)既可以在浏览器中使用,也可以通过 HTTP API 使用,因此您无需自行托管或扩展模型。
非常适合:高转化视频广告 |品牌一致的产品动画|电影故事板和预览

Kling 3.0 Standard Image to Video(标准图生视频)#


Kling 3.0 Standard Image to Video(标准图生视频)是快手可立即投入生产的 AI 图像动画模型,可将单个静态图像转换为 3-15 秒的短片,并可选同步原生音轨、多段 prompt 场景节奏和用于身份一致性的参考元素。它是 Kling 3.0 系列中性价比最高的档位,不带音频的情况为每秒 0.084 美元,带音频的情况为每秒 0.126 美元。


主要规格#


项目取值
输出分辨率高达 1080p(典型)
帧率24–60 fps(可变)
持续时间3–15 秒
纵横比16:9、9:16、1:1
音频可选的原生音频
身份控制正面图片 + 参考 URL + 可选参考视频
定价$0.084/秒(无音频) · $0.126/秒(有音频)
输入格式jpg、jpeg、png、bmp、webp

参数#


RunComfy 上为 Kling 3.0 Standard Image to Video(标准图生视频)公开的输入控件:


参数必填类型默认范围/选项描述
prompt否string“”—运动、风格和相机方向的文本指导。
multi_prompt否array—0–20 项额外的提示片段推动场景进展;片段持续时间之和必须等于视频总持续时间。
multi_prompt[].prompt否string——序列中单个片段的文本。
multi_prompt[].duration否integer53–15(秒)该段的持续时间(以秒为单位)。
开始_图像_url*是 (*)字符串—网址要制作动画的主要静态图像。
duration否integer123–15(秒)输出剪辑总长度。
generate_audio否booleantruetrue/false是否生成同步音轨。
元素没有数组——用于稳定各个镜头的身份/风格的可选资产。
元素[].frontal_image_url没有字符串—网址用于主体身份的正面参考图像。
元素[].reference_image_urls没有数组—网址主题的其他角度/风格参考。
元素[].video_url没有字符串—网址用于指导动作/身份的简短参考视频。
shot_type否stringcustomize—运镜控制模式;customize 可自定义镜头运动。
negative_prompt否string模糊、扭曲和低质量—阻止不需要的工件或样式的术语。
cfg_scale没有数量0.50.5 —指导强度;较低有利于自然运动,较高则更强烈地执行提示。

定价#


Kling 3.0 Standard Image to Video(标准图生视频)在 RunComfy 上按渲染秒数计费:


模式价格
没有音频每秒 0.084 美元
有音频每秒 0.126 美元

5 秒的无声片段售价 0.42 美元,有声片段售价 0.63 美元。 15 秒的剪辑售价为 1.26 美元或 1.89 美元。启用音频需支付 1.5 倍的附加费。

相关模型

dreamina-3-0/image-to-video

利用Dreamina 3.0快速将静态图像转化为2K高质量动态视频,让创意更生动自然。

runway-gen-3-alpha/turbo/image-to-video

高还原度视频生成,轻松操控结构、风格与动作,创作更自由

wan-2-1/image-to-video

轻松将图片生成高品质动态视频,展现真实光影与自然运动效果。

wan-2-5/text-to-image

使用Wan 2.5从文字描述快速生成高质量图像,释放创作灵感,轻松实现概念可视化。

dreamina-3-0/text-to-video

Dreamina 3.0助力设计师快速将文字创意变为动态真实画面,轻松打造高质量视频内容。

runway-gen-4/turbo/image-to-video

精准匹配文本提示,生成动作真实、结构连贯的视频内容

常见问题

Kling 3.0 Standard Image to Video(标准图生视频)生成的成片,最高支持的分辨率和时长大约是多少?

Kling 3.0 Standard Image to Video(标准图生视频)可以生成高达 1080p 分辨率的视频,并且通常支持每个剪辑长达 15 秒的持续时间。在某些增强或 Pro/Omni 设置中,用户可以达到 60fps 的 4K。对于 Standard Image to Video(标准图生视频)任务,保持在这些限制范围内有助于保持输出稳定性并避免时间伪影。

Kling 3.0 Standard Image to Video(标准图生视频)对图像到视频动画的参考输入有限制吗?

是的。 Kling 3.0 Standard Image to Video(标准图生视频)在标准模式下允许一张主要参考图像,而 Omni 模式则支持多个参考图像甚至短视频,以实现一致的角色外观。使用超过支持的引用计数可能会导致图像到视频输出中的提示截断或运动不一致。

如何从 RunComfy 模型界面 过渡到 API 以用于 Kling 3.0 Standard Image to Video(标准图生视频)的生产使用?

要从 RunComfy 模型界面 中的 Kling 3.0 Standard Image to Video(标准图生视频)测试转向生产,开发人员应首先确认稳定的提示和参数行为,然后从 RunComfy 仪表板获取 API 密钥。API 与模型界面使用一致的端点,可通过带媒体与文本输入的 POST 请求实现图生视频的自动化生成。确保足够的美元信用并考虑批量处理更大的工作负载。

Kling 3.0 Standard Image to Video(标准图生视频)在图像到视频运动真实感方面与早期版本有何不同?

与 2.6 版本相比,Kling 3.0 Standard Image to Video(标准图生视频)在图像到视频渲染方面显着改进了深度、视差和运动稳定性。得益于 Omni One 框架下的时空注意力,它可以模拟自然的摄像机运动和动态光线变化,同时减少视觉失真。

是什么让 Kling 3.0 Standard Image to Video(标准图生视频)从 Seedance 1.0 Pro 或 Wan 2.5 等竞争对手中脱颖而出?

Kling 3.0 Standard Image to Video(标准图生视频)因其更高的运动保真度和更长的 15 秒限制而脱颖而出,可处理 1080p 至 4K 输出和物理感知运动。 Seedance 具有非常精确的口型同步音频,而 Kling 则提供了更加集成的图像到视频框架,结合了灯光真实感、参考锚定和叙事摄像机控制。

Kling 3.0 Standard Image to Video(标准图生视频)能否为图像转视频场景生成同步音频?

是的。 Kling 3.0 Standard Image to Video(标准图生视频)包括与产生的运动一致的原生音频生成。它可以在图像到视频创建过程中直接合成环境声音、对话或效果,但高级的多扬声器场景可能需要后期改进。

Kling 3.0 Standard Image to Video(标准图生视频)如何保持生成帧之间的主题一致性?

Kling 3.0 Standard Image to Video(标准图生视频)使用参考图像锚定来确保图像到视频生成过程中的身份稳定性。底层模型跟踪每个帧的结构和颜色一致性,即使在高速运动场景中也能最大限度地减少闪烁和漂移。

Kling 3.0 Standard Image to Video(标准图生视频)是否适合商业用途和生产流程?

如果您的使用符合原始 Kling AI 许可证,Kling 3.0 Standard Image to Video(标准图生视频)输出可以用于商业用途。开发人员应在重新分发之前验证条款。对于专业管道,该解决方案可与 RunComfy 的 API 顺利集成,以实现自动化图像到视频工作流程和批量渲染。

在执行图像转视频创建时,Kling 3.0 Standard Image to Video(标准图生视频)支持哪些输入格式?

Kling 3.0 Standard Image to Video(标准图生视频)接受标准图像文件(JPG、PNG、WEBP)和可选文本提示。它还可以处理其他元数据,例如摄像机角度或照明偏好,以指导图像到视频场景的生成。

Kling 3.0 Standard Image to Video(标准图生视频)在创意制作中的最佳用例有哪些?

Kling 3.0 Standard Image to Video(标准图生视频)在动画肖像、产品展示和简短的电影预告片方面表现出色,在这些方面,平滑的图像到视频转换很重要。其优势包括物理感知运动和高场景保真度,使其成为数字营销剪辑、社交媒体故事讲述和视觉特效预览的理想选择。

关注我们
  • 领英
  • Facebook
  • Instagram
  • Twitter
支持
  • Discord
  • 电子邮件
  • 系统状态
  • 附属
视频模型
  • Wan 2.6 Flash
  • Kling Video O3 Pro Image To Video
  • Wan 2.6
  • Seedance 2.0 Fast
  • Hailuo 2.3 Fast Standard
  • Kling 3.0
  • 查看所有模型 →
图像模型
  • seedream 4.0
  • Nano Banana 2 Edit
  • Flux 2 Dev
  • Nano Banana Pro
  • GPT Image 2 Image Edit
  • FLUX.1 Schnell
  • 查看所有模型 →
法律
  • 服务条款
  • 隐私政策
  • Cookie 政策
RunComfy
版权 2026 RunComfy. 保留所有权利。

RunComfy 是首选的 ComfyUI 平台,提供 ComfyUI 在线 环境和服务,以及 ComfyUI 工作流 具有惊艳的视觉效果。 RunComfy还提供 AI Models, 帮助艺术家利用最新的AI工具创作出令人惊叹的艺术作品。

Kling 3.0 Standard Image to Video(标准图生视频)示例

Video thumbnail
Loading...
Video thumbnail
Loading...
Video thumbnail
Loading...
Video thumbnail
Loading...
Video thumbnail
Loading...
Video thumbnail
Loading...