HappyHorse 1.0 参考视频：多图像主题到视频 AI 模型 | Models and API

happyhorse/happyhorse-1.0/reference-to-video

HappyHorse 1.0 参考视频融合了多达 9 个参考图像和文本提示，可在 RunComfy 上生成 3-15 秒的 720P/1080P 剪辑 - 使用角色 1/角色 2 标签锁定角色、服装和道具。

参考图像 1（角色 1） *

第一个参考图像。在提示中将此主题标记为“character1”。格式：JPEG、JPG、PNG 或 WEBP。短边≥400px，建议720P或更高，最大10MB。

参考图像 2（字符 2）

可选的第二个参考图像。在提示中将此主题标记为“character2”。格式：JPEG、JPG、PNG 或 WEBP。留空可跳过。

参考图像 3（角色 3）

可选的第三个参考图像。在提示中将此主题标记为“character3”。格式：JPEG、JPG、PNG 或 WEBP。留空可跳过。

参考图像 4（字符 4）

可选的第四个参考图像。在提示中将此主题标记为“character4”。留空可跳过。

参考图像 5（字符 5）

可选的第五个参考图像。在提示中将此主题标记为“character5”。留空可跳过。

参考图像 6（字符 6）

可选的第六参考图像。在提示中将此主题标记为“character6”。留空可跳过。

参考图像 7（字符 7）

可选的第七个参考图像。在提示中将此主题标记为“character7”。留空可跳过。

参考图像 8（字符 8）

可选的第八个参考图像。在提示中将此主题标记为“character8”。留空可跳过。

参考图像 9（字符 9）

可选的第九个参考图像。在提示中将此主题标记为“character9”。留空可跳过。

提示词 *

描述场景、动作、摄像机和灯光。按照上面出现的顺序，使用字符 1、字符 2、字符 3 ... 来引用每个参考图像。最多 2500 个中文/5000 个非中文字符。

纵横比（宽：高）

输出视频宽高比。

分辨率

输出视频分辨率。该模型支持 720P 或 1080P。

时长

输出视频持续时间（以秒为单位）。允许值：3–15。

种子

可繁殖世代的可选种子。使用 0 让提供者随机化。

Idle

$0.15 per second for 720P and $0.28 per second for 1080P.

HappyHorse 1.0 Reference to Video 简介

HappyHorse 1.0 Reference to Video 现已通过阿里巴巴在 RunComfy 上提供。上传 1-9 张参考图像，编写提示，将每个主题标记为角色 1、角色 2、角色 3 …，然后模型将它们组合成一个具有稳定身份、服装和道具保真度的连贯剪辑。它基于 Arena 排名第一的 HappyHorse 1.0 统一Transformer（Elo 1392) 构建，可保持面部、服装和配饰视觉锁定，同时添加 720P 或 1080P 的电影动作。
适合：多角色讲故事 |虚拟试穿道具交换 |角色+服装+配饰视频|品牌资产组装|电影广告预告片

X 上的 HappyHorse 1.0 R2V：新闻和更新

YouTube 上的 HappyHorse 1.0 R2V：演示和评论

HappyHorse 1.0 参考视频#

RunComfy 上的此模板使用阿里巴巴的异步视频合成 API 和“happyhorse-1.0-r2v”模型。您上传 1 到 9 张参考图像，按照出现的顺序将提示中的每张图像称为“角色 1”、“角色 2”、“角色 3”……，模型将这些主题融合成一个连贯的视频，同时保留身份、颜色、材质和构图。

该模型无需在文本到视频的自由度和图像到视频的保真度之间进行选择，而是让您将演员阵容（角色、服装、道具、配饰）引入一个提示中，并用自然语言指导他们。该模型由具有 DMD-2 蒸馏功能的 15B 参数统一 Transformer 提供支持，以具有竞争力的速度提供 1080p 输出，而不会牺牲面部保真度、服装细节或场景连续性。

输出格式：视频/分辨率等级：720P 或 1080P/持续时间：3–15 秒/宽高比：16:9、9:16、1:1、4:3、3:4/参考图像：每次生成可上传 1–9 张

参数#

参数	必填	类型	默认	范围/选项	描述
图片_url_1*	是的	字符串	—	JPEG、JPG、PNG、WEBP	第一个参考图像，在提示中标记为“character1”。
image_url_2 … image_url_9	没有	字符串	—	JPEG、JPG、PNG、WEBP	可选的附加参考图像，标记为角色 2 … 角色 9。
prompt*	是（*）	string	—	最多2500个中文/5000个非中文字符	场景、动作、摄像机、灯光；使用character1/character2/…来引用每个图像。
纵横比	没有	字符串	16:9	16:9、9:16、1:1、4:3、3:4	输出纵横比。
分辨率	没有	字符串	1080P	720P、1080P	输出视频分辨率档位。
持续时间	没有	整数	5	3–15	输出视频持续时间（以秒为单位）。
种子	没有	整数	0	0 至 2147483647	可选的随机种子。使用 0 让提供者自动选择一个。
水印	没有	布尔	假	真，假	是否在生成的视频上包含提供商水印。

如何使用#

上传参考图片 1（通常是主角），然后添加最多 8 张用于服装、道具或配角。
在提示中，按位置引用每个上传：character1 = image 1、character2 = image 2，依此类推。
描述运动、摄像机移动、灯光演变以及您想要的视觉节拍。
选择宽高比、720P 或 1080P，以及 3 到 15 秒之间的持续时间。
可以选择修复种子以进行可重复的比较。
提交并下载完成的剪辑。

提示技巧#

将每个角色的名字固定在一个句子中：“角色 1 穿着角色 2，拿着角色 3，走过阳光明媚的走廊。”
以动作和镜头动词引导 - 漂移、推入、轨道、向上倾斜、推动、展示。
指定必须保持锁定的内容：面孔、服装、包装、徽标位置。
添加灯光演变（太阳在脸上移动，霓虹灯闪烁）以获得电影效果。
使每个剪辑保持一个清晰的视觉节拍；该模型可以最清晰地渲染单一意图的镜头。
使用清晰、光线充足、≥720P 的参考图像；避免严重压缩或裁剪的主题。
比较提示或参考变体时重复使用相同的种子。

图片要求#

格式：JPEG、JPG、PNG 或 WEBP。
短边≥400px，建议720P或更高。
每张图像的文件大小 ≤ 10MB。
公共 HTTP/HTTPS URL；避免模糊、过度压缩或带水印的源图像。

注释#

此模板参考视频；对于单图像动画，请使用 HappyHorse 1.0 I2V 模板；对于仅提示生成，请使用 HappyHorse 1.0 文本到视频模板。
此模板中不公开 3-15 秒之外的持续时间。
生成的视频URL由提供商返回，24小时内有效；立即下载或重新托管。

常见问题

HappyHorse 1.0 对视频的引用是什么？

HappyHorse 1.0 对视频的引用是 HappyHorse 1.0 的多图像主题到视频模式 — Arena 排名第一的视频模型 (Elo 1392)。它接受 1 到 9 个参考图像加上一个文本提示，将每个主题标记为角色 1、角色 2、角色 3 …，然后将它们融合成一个具有稳定身份、服装和道具保真度的连贯 720P/1080P 剪辑。

它与文本转视频和图像转视频有何不同？

文字转视频仅从文字开始；图像到视频对一个源帧进行动画处理；视频参考将多个主题（一个人、一套服装、一件配饰、一个道具）带入同一代，并让您通过一个提示来引导它们。它将文本提示的自由度与参考图像的身份锁定强度结合在一起。

如何引用提示中的每个图像？

参考顺序由上传位置决定。图像 1 是字符 1，图像 2 是字符 2，图像 3 是字符 3，依此类推，直到字符 9。在提示中，您可以写下类似“角色 1 穿着角色 2，拿着角色 3，走过阳光明媚的走廊”——模型将每个标签绑定到匹配的参考图像。

模型输出的分辨率和持续时间是多少？

该模型输出原生 720P 或 1080P 剪辑，可选择持续时间从 3 到 15 秒，宽高比为 16:9、9:16、1:1、4:3 和 3:4。输出质量适合广告投放和社交发布，无需重新分级。

参考图像有什么要求？

每个参考图像必须是 JPEG、JPG、PNG 或 WEBP，短边至少为 400 像素（建议 720P 或更高），文件大小小于 10MB，通过公共 HTTP/HTTPS URL 提供。避免模糊、严重压缩或带水印的来源——清晰、光线充足的参考为模型提供锁定身份的最佳机会。

什么样的提示最有效？

将每个角色标签固定在一个句子中，然后描述动作和镜头语言：漂移、推入、轨道、向上倾斜、推动、显示。说明必须锁定的内容（面孔、服装、包装），添加灯光演变以获得电影般的感觉，并使每个剪辑保持清晰的视觉节拍。比较提示或参考变体时重复使用相同的种子。

典型的用例有哪些？

该模型非常适合多角色故事讲述、道具交换虚拟试穿、角色+服装+配件视频、品牌资产组装、包装到演示的过渡以及电影广告预告片，在这些情况下，您已经拥有一组参考资产并需要它们以稳定的身份一起移动。

RunComfy

RunComfy 是首选的 ComfyUI 平台，提供 ComfyUI 在线环境和服务，以及 ComfyUI 工作流具有惊艳的视觉效果。 RunComfy还提供 AI Models, 帮助艺术家利用最新的AI工具创作出令人惊叹的艺术作品。