Wan 2.1 | 革命性的视频生成
更新于 2025 年 6 月 16 日:ComfyUI 版本更新到 v0.3.39,以提高稳定性和兼容性。Wan 2.1 在视频创作基准测试中超越所有竞争对手。其 1.3B 模型仅需 8.19GB VRAM,支持文本到视频和图像到视频工作流程,在标准硬件上可在 4 分钟内制作 480P 视频。Wan 2.1 14B 模型通过 RunComfy 的云提供增强的 720P 质量。作为第一个在视频中生成中文和英文文本的模型,Wan 2.1 扩展了创作选项,同时其 Wan-VAE 后端高效处理 1080P 视频,保持时间一致性。ComfyUI Wan 2.1 工作流程
ComfyUI Wan 2.1 示例
ComfyUI Wan 2.1 描述
ComfyUI Wan 2.1 工作流程描述
1. 什么是 Wan 2.1?
ComfyUI Wan 2.1 工作流程是一个前沿的视频生成管道,利用最新的 Wan 2.1 模型从文本提示或/和基础图像创建高质量视频。Wan 2.1 支持文本到视频(T2V)和图像到视频(I2V)生成,制作自然运动和专业质量的 5 秒视频。Wan 2.1 为 AI 视频生成树立了新的标杆,超越开源和商业替代方案。Wan 2.1 14B 模型进一步突破极限,提供高达 720P 的卓越效果。
2. Wan 2.1 的优势和功能
- 高质量输出: 生成具有逼真运动和高保真纹理的 480P 至 720P 视频。
- 硬件兼容性: 轻量级的 Wan 2.1 1.3B 模型仅需 8.19GB VRAM,使其与大多数现代 GPU 兼容(由 RunComfy 提供!)。
- 多样化生成: Wan 2.1 支持文本到视频(T2V)和图像到视频(I2V)工作流程。
- 多语言支持: Wan 2.1 是第一个能在视频中生成中文和英文文本的视频模型。
- VAE 效率: Wan-VAE 后端高效处理 1080P 视频,同时保持时间一致性。
- 快速处理: Wan 2.1 1.3B 模型在保持质量的同时提供快速结果。
3. 如何使用 Wan 2.1
3.1 Wan 2.1 生成方法
主要 Wan 2.1 生成方法(默认禁用):文本到视频
- 输入: 文本提示
- 最佳用途: 使用文本描述从头创建视频
- 特点:
- 使用 Wan 2.1 1.3B 模型实现更快生成
- 创建 33 帧(5 秒)480P 分辨率的视频
- 优化短片的流畅运动
高级 Wan 2.1 方法(默认启用):带文本提示的图像到视频
- 输入: 基础图像 + 文本提示
- 最佳用途: 动画化静态图像,同时用提示引导运动
- 特点:
- 保留输入图像的视觉元素
- 允许文本控制运动方向
- 使用 Wan 2.1 14B 模型提供更高保真度
- 创建 33 帧 512x512 分辨率的视频
示例工作流程:
- 在 CLIPTextEncode(正面提示/负面提示): 输入您的场景描述(例如,"a fox moving quickly in a beautiful winter landscape with trees and mountains during daytime, tracking camera")。
- 在 Load Image: 上传您的基础图像。
- 如需进一步优化(可选):
- 在 KSampler: 调整
steps
(默认:30),以平衡质量与速度。 - 在 ModelSamplingSD3: 修改
scale
值(默认:8),以确保提示的遵循。
- 在 KSampler: 调整
- 点击 Queue Prompt 开始生成。
- 在 SaveAnimatedWEBP 找到您的输出预览(也保存在 ComfyUI > Output 文件夹中)。
3.2 Wan 2.1 的参数参考
- KSampler:
steps
:20-30(较高值提高质量但增加时间)cfg
:6.0(控制提示遵循强度)scheduler
:"simple"(确定噪声调度方法)sampler_name
:"uni_pc"(推荐的 Wan 2.1 采样器)
- WanImageToVideo:
width/height
:512(输出分辨率)length
:33(每个视频的帧数)batch_size
:1(每次运行的视频数量)
- ModelSamplingSD3:
scale
:8(控制引导遵循)
- EmptyHunyuanLatentVideo:
width/height
:832/480(T2V 输出分辨率)length
:33(每个视频的帧数)batch_size
:1(每次运行的视频数量)
3.3 Wan 2.1 的高级优化
- 内存优化:
- 使用 Wan 2.1 1.3B 模型以更低的 VRAM 需求实现更快的生成。
- 降低分辨率(例如 512x320)以加快处理速度。
- 减少帧数以实现更短更快的渲染。
- 质量优化:
- 使用 Wan 2.1 14B 模型以获得更高质量的输出。
- 将 KSampler 步骤增加到 30-40 以获得更精细的结果。
- 使用高质量的基础图像进行图像到视频以获得最佳保真度。
更多信息
有关 Wan 2.1 的更多详细信息,请访问 。
致谢
Wan 2.1 模型由 Wan 团队开发,ComfyUI 集成由原始开发者创建。所有功劳归于这些创新者,他们推动了 AI 驱动的视频生成的发展。
想要更多 ComfyUI 工作流吗?
RunComfy
版权 2025 RunComfy. 保留所有权利。RunComfy 是首选的 ComfyUI 平台,提供 ComfyUI 在线 环境和服务,以及 ComfyUI 工作流 具有惊艳的视觉效果。 RunComfy还提供 AI Playground, 帮助艺术家利用最新的AI工具创作出令人惊叹的艺术作品。