Wan 2.1 | 革命性视频生成
Wan 2.1 在视频创作基准测试中超越所有竞争对手。其 1.3B 模型仅需 8.19GB VRAM,支持文本到视频和图像到视频的工作流程,可在标准硬件上 4 分钟内生成 480P 视频。Wan 2.1 14B 模型通过 RunComfy 的云提供更高的 720P 质量。作为第一个在视频中生成中英文文本的模型,Wan 2.1 扩展了创作选项,而其 Wan-VAE 后端高效处理 1080P 视频并保持时间一致性。ComfyUI Wan 2.1 工作流程
ComfyUI Wan 2.1 示例
ComfyUI Wan 2.1 描述
ComfyUI Wan 2.1 工作流程描述
1. 什么是 Wan 2.1?
ComfyUI Wan 2.1 工作流程是一个前沿的视频生成管道,利用最新的 Wan 2.1 模型从文本提示或/和基础图像创建高质量的视频。Wan 2.1 支持文本到视频 (T2V) 和图像到视频 (I2V) 生成,制作具有自然运动和专业级质量的 5 秒视频。Wan 2.1 为 AI 视频生成设定了新的基准,性能优于开源和商业替代品。Wan 2.1 14B 模型进一步突破极限,提供高达 720P 的卓越结果。
2. Wan 2.1 的优势和功能
- 高质量输出: 生成 480P 到 720P 的视频,具有逼真的运动和高保真纹理。
- 硬件可访问性: 轻量级的 Wan 2.1 1.3B 模型仅需 8.19GB VRAM,使其与大多数现代 GPU 兼容(由 RunComfy 提供!)。
- 多功能生成: Wan 2.1 支持文本到视频 (T2V) 和图像到视频 (I2V) 工作流程。
- 多语言支持: Wan 2.1 是第一个能够在视频中生成中英文文本的视频模型。
- VAE 效率: Wan-VAE 后端高效处理 1080P 视频,同时保持时间一致性。
- 快速处理: Wan 2.1 1.3B 模型在保持质量的同时提供快速结果。
3. 如何使用 Wan 2.1
3.1 Wan 2.1 生成方法
主要 Wan 2.1 生成方法(默认禁用):文本到视频
- 输入: 文本提示
- 最佳用途: 使用文本描述从头开始创建视频
- 特征:
- 使用 Wan 2.1 1.3B 模型进行更快生成
- 创建 33 帧(5 秒)的视频,分辨率为 480P
- 针对短片中的平滑运动进行了优化
高级 Wan 2.1 方法(默认启用):图像到视频加文本提示
- 输入: 基础图像 + 文本提示
- 最佳用途: 动态化静止图像,同时用提示引导运动
- 特征:
- 保留输入图像的视觉元素
- 允许文本控制运动方向
- 使用 Wan 2.1 14B 模型实现更高保真度
- 创建 33 帧视频,分辨率为 512x512
示例工作流程:
- 在 CLIPTextEncode (Positive Prompt / Negative Prompt): 输入场景描述(例如,"一只狐狸在白天美丽的冬季景观中快速移动,镜头跟踪")。
- 在 Load Image: 上传您的基础图像。
- 进一步优化(可选):
- 在 KSampler: 调整
steps
(默认:30)以平衡质量与速度。 - 在 ModelSamplingSD3: 修改
scale
值(默认:8)以增强提示遵循性。
- 在 KSampler: 调整
- 点击 Queue Prompt 开始生成。
- 在 SaveAnimatedWEBP 中找到您的输出预览(也保存在 ComfyUI > Output 文件夹中)。
3.2 Wan 2.1 参数参考
- KSampler:
steps
:20-30(更高的值提高质量但增加时间)cfg
:6.0(控制提示遵循强度)scheduler
:"simple"(决定噪声调度方法)sampler_name
:"uni_pc"(推荐的 Wan 2.1 采样器)
- WanImageToVideo:
width/height
:512(输出分辨率)length
:33(每个视频的帧数)batch_size
:1(每次运行的视频数量)
- ModelSamplingSD3:
scale
:8(控制指导遵循)
- EmptyHunyuanLatentVideo:
width/height
:832/480(T2V 输出分辨率)length
:33(每个视频的帧数)batch_size
:1(每次运行的视频数量)
3.3 使用 Wan 2.1 进行高级优化
- 内存优化:
- 使用 Wan 2.1 1.3B 模型进行更快生成,降低 VRAM 要求。
- 降低分辨率(例如,512x320)以加快处理速度。
- 减少帧数以缩短和加快渲染。
- 质量优化:
- 使用 Wan 2.1 14B 模型以获得更高质量的输出。
- 增加 KSampler 步骤到 30-40 以获得更精致的结果。
- 使用高质量的基础图像进行图像到视频以获得最佳保真度。
更多信息
有关 Wan 2.1 的更多详细信息,请访问 。
致谢
Wan 2.1 模型由 Wan 团队开发,ComfyUI 集成由原始开发者创建。全体功劳归于这些创新者,他们推动了 AI 驱动的视频生成的进步。