logo
RunComfy
  • ComfyUI
  • 训练器新
  • 模型
  • API
  • 定价
discord logo
模型
探索
所有模型
资源库
生成记录
模型 API
API 文档
API 密钥
账户
使用情况

HappyHorse 1.0 参考视频:多图像主题到视频 AI 模型 | Models and API | RunComfy

happyhorse/happyhorse-1.0/reference-to-video

HappyHorse 1.0 参考视频融合了多达 9 个参考图像和文本提示,可在 RunComfy 上生成 3-15 秒的 720P/1080P 剪辑 - 使用角色 1/角色 2 标签锁定角色、服装和道具。

第一个参考图像。在提示中将此主题标记为“character1”。格式:JPEG、JPG、PNG 或 WEBP。短边≥400px,建议720P或更高,最大10MB。
可选的第二个参考图像。在提示中将此主题标记为“character2”。格式:JPEG、JPG、PNG 或 WEBP。留空可跳过。
可选的第三个参考图像。在提示中将此主题标记为“character3”。格式:JPEG、JPG、PNG 或 WEBP。留空可跳过。
可选的第四个参考图像。在提示中将此主题标记为“character4”。留空可跳过。
可选的第五个参考图像。在提示中将此主题标记为“character5”。留空可跳过。
可选的第六参考图像。在提示中将此主题标记为“character6”。留空可跳过。
可选的第七个参考图像。在提示中将此主题标记为“character7”。留空可跳过。
可选的第八个参考图像。在提示中将此主题标记为“character8”。留空可跳过。
可选的第九个参考图像。在提示中将此主题标记为“character9”。留空可跳过。
描述场景、动作、摄像机和灯光。按照上面出现的顺序,使用字符 1、字符 2、字符 3 ... 来引用每个参考图像。最多 2500 个中文/5000 个非中文字符。
输出视频宽高比。
输出视频分辨率。该模型支持 720P 或 1080P。
输出视频持续时间(以秒为单位)。允许值:3–15。
可繁殖世代的可选种子。使用 0 让提供者随机化。
Idle
$0.15 per second for 720P and $0.28 per second for 1080P.

HappyHorse 1.0 Reference to Video 简介

HappyHorse 1.0 Reference to Video 现已通过阿里巴巴在 RunComfy 上提供。上传 1-9 张参考图像,编写提示,将每个主题标记为角色 1、角色 2、角色 3 …,然后模型将它们组合成一个具有稳定身份、服装和道具保真度的连贯剪辑。它基于 Arena 排名第一的 HappyHorse 1.0 统一Transformer(Elo 1392) 构建,可保持面部、服装和配饰视觉锁定,同时添加 720P 或 1080P 的电影动作。
适合:多角色讲故事 |虚拟试穿道具交换 |角色+服装+配饰视频|品牌资产组装|电影广告预告片

X 上的 HappyHorse 1.0 R2V:新闻和更新

YouTube 上的 HappyHorse 1.0 R2V:演示和评论

YouTube preview
YouTube preview

HappyHorse 1.0 参考视频#


RunComfy 上的此模板使用阿里巴巴的异步视频合成 API 和“happyhorse-1.0-r2v”模型。您上传 1 到 9 张参考图像,按照出现的顺序将提示中的每张图像称为“角色 1”、“角色 2”、“角色 3”……,模型将这些主题融合成一个连贯的视频,同时保留身份、颜色、材质和构图。


该模型无需在文本到视频的自由度和图像到视频的保真度之间进行选择,而是让您将演员阵容(角色、服装、道具、配饰)引入一个提示中,并用自然语言指导他们。该模型由具有 DMD-2 蒸馏功能的 15B 参数统一 Transformer 提供支持,以具有竞争力的速度提供 1080p 输出,而不会牺牲面部保真度、服装细节或场景连续性。


输出格式:视频/分辨率等级:720P 或 1080P/持续时间:3–15 秒/宽高比:16:9、9:16、1:1、4:3、3:4/参考图像:每次生成可上传 1–9 张


参数#


参数必填类型默认范围/选项描述
图片_url_1*是的字符串—JPEG、JPG、PNG、WEBP第一个参考图像,在提示中标记为“character1”。
image_url_2 … image_url_9没有字符串—JPEG、JPG、PNG、WEBP可选的附加参考图像,标记为角色 2 … 角色 9。
prompt*是(*)string—最多2500个中文/5000个非中文字符场景、动作、摄像机、灯光;使用character1/character2/…来引用每个图像。
纵横比没有字符串16:916:9、9:16、1:1、4:3、3:4输出纵横比。
分辨率没有字符串1080P720P、1080P输出视频分辨率档位。
持续时间没有整数53–15输出视频持续时间(以秒为单位)。
种子没有整数00 至 2147483647可选的随机种子。使用 0 让提供者自动选择一个。
水印没有布尔假真,假是否在生成的视频上包含提供商水印。

如何使用#


  1. 上传参考图片 1(通常是主角),然后添加最多 8 张用于服装、道具或配角。
  2. 在提示中,按位置引用每个上传:character1 = image 1、character2 = image 2,依此类推。
  3. 描述运动、摄像机移动、灯光演变以及您想要的视觉节拍。
  4. 选择宽高比、720P 或 1080P,以及 3 到 15 秒之间的持续时间。
  5. 可以选择修复种子以进行可重复的比较。
  6. 提交并下载完成的剪辑。

提示技巧#


  • 将每个角色的名字固定在一个句子中:“角色 1 穿着角色 2,拿着角色 3,走过阳光明媚的走廊。”
  • 以动作和镜​​头动词引导 - 漂移、推入、轨道、向上倾斜、推动、展示。
  • 指定必须保持锁定的内容:面孔、服装、包装、徽标位置。
  • 添加灯光演变(太阳在脸上移动,霓虹灯闪烁)以获得电影效果。
  • 使每个剪辑保持一个清晰的视觉节拍;该模型可以最清晰地渲染单一意图的镜头。
  • 使用清晰、光线充足、≥720P 的参考图像;避免严重压缩或裁剪的主题。
  • 比较提示或参考变体时重复使用相同的种子。

图片要求#


  • 格式:JPEG、JPG、PNG 或 WEBP。
  • 短边≥400px,建议720P或更高。
  • 每张图像的文件大小 ≤ 10MB。
  • 公共 HTTP/HTTPS URL;避免模​​糊、过度压缩或带水印的源图像。

注释#


  • 此模板参考视频;对于单图像动画,请使用 HappyHorse 1.0 I2V 模板;对于仅提示生成,请使用 HappyHorse 1.0 文本到视频模板。
  • 此模板中不公开 3-15 秒之外的持续时间。
  • 生成的视频URL由提供商返回,24小时内有效;立即下载或重新托管。

相关模型

kling-2-1-pro/image-to-video

让静态图像焕发生命,Kling 2.1 轻松生成高质量动态视频,助力创意设计与视觉表达。

veo-3-1/fast/image-to-video

使用Veo 3.1 Fast轻松将图片或文字转化为高质量电影级视频,创作高效灵活。

dreamina-3-0/pro/image-to-video

将静态图片快速生成高质量2K动态视频,精准还原创意细节,助力设计与视觉表达。

wan-2-2/vace-fun

快速将静态图像转化为流畅的视频动画,保持人物一致性与电影级动感效果。

hailuo-02/pro/image-to-video

用Hailuo 02 Pro轻松将静态图像转化为高清动态视频,释放创意潜能。

wan-2-6/image-to-video

使用Wan 2.6将静态图像转换为动态同步的高清视频内容,支持灵活控制。

常见问题

HappyHorse 1.0 对视频的引用是什么?

HappyHorse 1.0 对视频的引用是 HappyHorse 1.0 的多图像主题到视频模式 — Arena 排名第一的视频模型 (Elo 1392)。它接受 1 到 9 个参考图像加上一个文本提示,将每个主题标记为角色 1、角色 2、角色 3 …,然后将它们融合成一个具有稳定身份、服装和道具保真度的连贯 720P/1080P 剪辑。

它与文本转视频和图像转视频有何不同?

文字转视频仅从文字开始;图像到视频对一个源帧进行动画处理;视频参考将多个主题(一个人、一套服装、一件配饰、一个道具)带入同一代,并让您通过一个提示来引导它们。它将文本提示的自由度与参考图像的身份锁定强度结合在一起。

如何引用提示中的每个图像?

参考顺序由上传位置决定。图像 1 是字符 1,图像 2 是字符 2,图像 3 是字符 3,依此类推,直到字符 9。在提示中,您可以写下类似“角色 1 穿着角色 2,拿着角色 3,走过阳光明媚的走廊”——模型将每个标签绑定到匹配的参考图像。

模型输出的分辨率和持续时间是多少?

该模型输出原生 720P 或 1080P 剪辑,可选择持续时间从 3 到 15 秒,宽高比为 16:9、9:16、1:1、4:3 和 3:4。输出质量适合广告投放和社交发布,无需重新分级。

参考图像有什么要求?

每个参考图像必须是 JPEG、JPG、PNG 或 WEBP,短边至少为 400 像素(建议 720P 或更高),文件大小小于 10MB,通过公共 HTTP/HTTPS URL 提供。避免模​​糊、严重压缩或带水印的来源——清晰、光线充足的参考为模型提供锁定身份的最佳机会。

什么样的提示最有效?

将每个角色标签固定在一个句子中,然后描述动作和镜头语言:漂移、推入、轨道、向上倾斜、推动、显示。说明必须锁定的内容(面孔、服装、包装),添加灯光演变以获得电影般的感觉,并使每个剪辑保持清晰的视觉节拍。比较提示或参考变体时重复使用相同的种子。

典型的用例有哪些?

该模型非常适合多角色故事讲述、道具交换虚拟试穿、角色+服装+配件视频、品牌资产组装、包装到演示的过渡以及电影广告预告片,在这些情况下,您已经拥有一组参考资产并需要它们以稳定的身份一起移动。

关注我们
  • 领英
  • Facebook
  • Instagram
  • Twitter
支持
  • Discord
  • 电子邮件
  • 系统状态
  • 附属
视频模型
  • Wan 2.6 Flash
  • Hailuo 2.3 Fast Standard
  • Wan 2.6
  • Wan 2.7 Reference to Video
  • Seedance 2.0 Fast
  • Seedance 2.0 Pro
  • 查看所有模型 →
图像模型
  • seedream 4.0
  • Flux 2 Dev
  • Nano Banana 2 Edit
  • Nano Banana Pro
  • Qwen Image Edit 2511 LoRA
  • Nano Banana 2
  • 查看所有模型 →
法律
  • 服务条款
  • 隐私政策
  • Cookie 政策
RunComfy
版权 2026 RunComfy. 保留所有权利。

RunComfy 是首选的 ComfyUI 平台,提供 ComfyUI 在线 环境和服务,以及 ComfyUI 工作流 具有惊艳的视觉效果。 RunComfy还提供 AI Models, 帮助艺术家利用最新的AI工具创作出令人惊叹的艺术作品。

HappyHorse 1.0 R2V 创作示例

Video thumbnail
Loading...
Video thumbnail
Loading...
Video thumbnail
Loading...
Video thumbnail
Loading...
Video thumbnail
Loading...
Video thumbnail
Loading...