fantasy-portrait/image-to-video

fantasy-portrait/image-to-video

Controls how strongly the Fantasy Portrait embedding influences the video generation, higher emphasizes the portrait and expressions.
Number of denoising iterations; more steps refine detail and stability but take longer.
Controls how strongly the output adheres to the prompt versus allowing creative variation.
Offsets the diffusion sampling schedule, trading stability for stronger motion/style as the value increases.

Fantasy Portrait 简介

本版本允许您使用来自 Fantasy-AMAP 的 FantasyPortrait 模型,结合 Wan 2.1 以及可选的轻量级 LoRA,将静态图像转化为具有电影质感的 Fantasy Portrait 动画。系统在保持人物身份一致性的同时,呈现丰富的面部细节与表情,为希望从单张人像中获得电影级动态效果的创作者提供情感充沛的视频片段。

Fantasy Portrait 帮助您将静态图片转化为保留身份特征的动态动画。无论是创作者、艺术家还是讲故事的人,它都能从一张人像照片和一段视频中生成自然流畅、富有表现力的动画剪辑。输出结果为高保真 MP4 视频,画面构图一致、质感精致,具备专业级影视效果。

Fantasy Portrait 的核心模型

FantasyPortrait (Fantasy-AMAP)

FantasyPortrait 模型提供核心的身份与表情特征嵌入,确保主体特征得到保留,同时允许微妙的面部动态变化。它是 Fantasy Portrait 工作流程的核心。您可以通过 GitHub 项目 以及相关的 arXiv 论文 了解更多信息。

WanVideo 2.1 I2V (14B, 720p)

WanVideo 2.1 作为视频扩散生成的主干网络,使得系统能够在肖像和提示的引导下生成高分辨率动画。它结合图像与文本条件进行视频采样,输出稳定且富有表现力的结果。您可以通过 Kijai 的 Hugging Face 模型包 获取量化版本与适用于 Comfy 的权重。

如何使用 Fantasy Portrait

必需输入项

首先,您需要在 Image 与 Video 输入中分别提供一张图片和一个视频,作为 Fantasy Portrait 生成动画的基础。设置 Width 和 Height 以确定输出分辨率,并通过 Number of Frames 控制动画的时长。这些输入对于保持画面一致性与确保合适的动画时间至关重要。

可选输入与控制项

通过添加简短描述性词语的 Prompt,您可以引导输出作品的艺术风格或情感氛围。需要时,您还可调整 Seed 来控制生成的随机性,使用 Shift 影响动作节奏,并通过 Steps 优化采样精度。这些可选参数让您能够在保持人物特征的前提下,灵活探索不同的风格变化。

输出结果

该工作流程会生成高质量的 MP4 视频,默认帧率为 16 fps,格式为 yuv420p。输出基于您提供的人像图像,结合模型嵌入与提示信息,生成具有电影表现力与情感张力的动态影像。最终结果是一段打磨精致的 Fantasy Portrait 动画。

最佳实践

为了获得最佳效果,请使用光线充足、干净的人像作为输入图像。上传动画中包含您期望的基础动作。保持 Prompt 简洁,聚焦于氛围或光影,而非主体身份的细节。适度调整 Steps 可提升画面锐度,而简明的提示词有助于保持表情自然。务必确保 Width、Height 和 Number of Frames 与您的期望画面构图和动画时长一致。

Related Playgrounds