轻松将人像照片转化为富有表现力的视频动画,释放创意灵感
Kling 3.0 是多模态 AI 视频生成模型:在 RunComfy 上把文本提示转为电影感镜头,支持多镜头编排、同步音轨与专业级运镜控制,适合短片叙事与品牌内容。
输出格式:高达 4K/高达 60 fps(因模式而异)/3–15 秒/16:9、9:16、1:1/可选同步音频
| 参数 | 必填 | 类型 | 默认 | 范围/选项 | 描述 |
|---|---|---|---|---|---|
| prompt* | 是(*) | string | — | — | 场景、动作、镜头风格和氛围的文字描述。 |
| negative_prompt | 否 | string | — | — | 要从视频中排除的元素。 |
| duration | 否 | number(秒) | 5 | 3–15 | 成片时长(秒)。 |
| aspect_ratio | 否 | enum | 16:9 | 16:9、9:16、1:1 | 输出画幅比例。 |
| cfg_scale | 否 | number | 0.5 | — | CFG:提示词约束强度,平衡「更听话」与「更发散」。 |
| sound | 否 | boolean | disabled | enabled/disabled | 是否生成与画面同步的声音。 |
| shot_type | 否 | enum | intelligent | intelligent/customize | 剪辑模式:智能自动分镜,或 customize 手动控制镜头。 |
| multi_prompt | 否 | array/string | — | — | 多段提示,用于镜头衔接与节奏推进。 |
| 计费单位 | 音频 | 价格 |
|---|---|---|
| 每生成一秒 | 已禁用 | 每秒 0.084 美元 |
| 每生成一秒 | 已启用 | 每秒 0.126 美元 |
7、导出交付:从RunComfy下载结果;宽高比和持续时间已针对您的频道进行调整。
轻松将人像照片转化为富有表现力的视频动画,释放创意灵感
使用 Wan 2.2 Flash 将文字快速转换为高质量图片,助力设计创作与视觉表达。
使用 Pika 2.2 从文本生成高清动画,快速实现创意视频制作。
精准匹配文本提示,生成动作真实、结构连贯的视频内容
智能文本转视频工具,支持1080p高质量生成,轻松打造生动镜头与真实情感,激发创作灵感。
使用Veo 3.1 Fast快速将静态图像转换为电影级视频,轻松实现创意动画制作。
Kling 3.0 支持多镜头电影序列(每段最多六个镜头)、同步多语言音频与更强角色一致性,统一多模态架构在同一模型中处理文本、图像与视频。
Kling 3.0 在时长(最长约 15 秒)与多镜头时间连贯性上通常优于 Seedance 1.0 Pro 与 Wan 2.5,运动更真实、口型与面孔更一致。
单次生成约 15 秒、最多六个连续镜头,宽高比多为 16:9、9:16、1:1,提示词约 1200 token,参考输入通常 3–5 个。
可以。Kling 3.0 可将最多六个镜头链成连贯 clip,在 RunComfy 模型界面或提示词中定义镜头类型与转场。
在 RunComfy 模型界面验证后,使用 RunComfy API:REST 端点、API 密钥、usd 积分与异步任务队列。
集成音频合成与动态口型,支持英、中、日、韩、西,无需单独配音流程。
支持专业镜头语义(摇移、dolly、俯仰、POV)与 motion brush。
Pro 运动连贯性与稳定性更高;Standard 更快、usd 积分更少。
取决于快手许可与 RunComfy 服务协议,部署前请查阅官方条款。
RunComfy 模型界面为云端渲染;API 多镜头因音画同步处理延迟更高。
RunComfy 是首选的 ComfyUI 平台,提供 ComfyUI 在线 环境和服务,以及 ComfyUI 工作流 具有惊艳的视觉效果。 RunComfy还提供 AI Models, 帮助艺术家利用最新的AI工具创作出令人惊叹的艺术作品。





