ComfyUI  >  工作流  >  Wan 2.1 | 革命性的视频生成

Wan 2.1 | 革命性的视频生成

更新于 2025 年 6 月 16 日:ComfyUI 版本更新到 v0.3.39,以提高稳定性和兼容性。Wan 2.1 在视频创作基准测试中超越所有竞争对手。其 1.3B 模型仅需 8.19GB VRAM,支持文本到视频和图像到视频工作流程,在标准硬件上可在 4 分钟内制作 480P 视频。Wan 2.1 14B 模型通过 RunComfy 的云提供增强的 720P 质量。作为第一个在视频中生成中文和英文文本的模型,Wan 2.1 扩展了创作选项,同时其 Wan-VAE 后端高效处理 1080P 视频,保持时间一致性。

ComfyUI Wan 2.1 工作流程

Wan 2.1 Workflow in ComfyUI | Premium Text & Image to Video Creation
想要运行这个工作流吗?
  • 完全可操作的工作流
  • 没有缺失的节点或模型
  • 无需手动设置
  • 具有惊艳的视觉效果

ComfyUI Wan 2.1 示例

ComfyUI Wan 2.1 描述

ComfyUI Wan 2.1 工作流程描述

1. 什么是 Wan 2.1?

ComfyUI Wan 2.1 工作流程是一个前沿的视频生成管道,利用最新的 Wan 2.1 模型从文本提示或/和基础图像创建高质量视频。Wan 2.1 支持文本到视频(T2V)和图像到视频(I2V)生成,制作自然运动和专业质量的 5 秒视频。Wan 2.1 为 AI 视频生成树立了新的标杆,超越开源和商业替代方案。Wan 2.1 14B 模型进一步突破极限,提供高达 720P 的卓越效果。

2. Wan 2.1 的优势和功能

  • 高质量输出: 生成具有逼真运动和高保真纹理的 480P 至 720P 视频。
  • 硬件兼容性: 轻量级的 Wan 2.1 1.3B 模型仅需 8.19GB VRAM,使其与大多数现代 GPU 兼容(由 RunComfy 提供!)。
  • 多样化生成: Wan 2.1 支持文本到视频(T2V)和图像到视频(I2V)工作流程。
  • 多语言支持: Wan 2.1 是第一个能在视频中生成中文和英文文本的视频模型。
  • VAE 效率: Wan-VAE 后端高效处理 1080P 视频,同时保持时间一致性。
  • 快速处理: Wan 2.1 1.3B 模型在保持质量的同时提供快速结果。

3. 如何使用 Wan 2.1

3.1 Wan 2.1 生成方法

Wan 2.1

主要 Wan 2.1 生成方法(默认禁用):文本到视频
  • 输入: 文本提示
  • 最佳用途: 使用文本描述从头创建视频
  • 特点:
    • 使用 Wan 2.1 1.3B 模型实现更快生成
    • 创建 33 帧(5 秒)480P 分辨率的视频
    • 优化短片的流畅运动

Wan 2.1

高级 Wan 2.1 方法(默认启用):带文本提示的图像到视频
  • 输入: 基础图像 + 文本提示
  • 最佳用途: 动画化静态图像,同时用提示引导运动
  • 特点:
    • 保留输入图像的视觉元素
    • 允许文本控制运动方向
    • 使用 Wan 2.1 14B 模型提供更高保真度
    • 创建 33 帧 512x512 分辨率的视频
示例工作流程:
  1. CLIPTextEncode(正面提示/负面提示): 输入您的场景描述(例如,"a fox moving quickly in a beautiful winter landscape with trees and mountains during daytime, tracking camera")。
  2. Load Image: 上传您的基础图像。
  3. 如需进一步优化(可选):
    • KSampler: 调整 steps(默认:30),以平衡质量与速度。
    • ModelSamplingSD3: 修改 scale 值(默认:8),以确保提示的遵循。
  4. 点击 Queue Prompt 开始生成。
  5. SaveAnimatedWEBP 找到您的输出预览(也保存在 ComfyUI > Output 文件夹中)。

3.2 Wan 2.1 的参数参考

  • KSampler:
    • steps:20-30(较高值提高质量但增加时间)
    • cfg:6.0(控制提示遵循强度)
    • scheduler:"simple"(确定噪声调度方法)
    • sampler_name:"uni_pc"(推荐的 Wan 2.1 采样器)

    Wan 2.1

  • WanImageToVideo:
    • width/height:512(输出分辨率)
    • length:33(每个视频的帧数)
    • batch_size:1(每次运行的视频数量)
  • ModelSamplingSD3:
    • scale:8(控制引导遵循)
  • EmptyHunyuanLatentVideo:
    • width/height:832/480(T2V 输出分辨率)
    • length:33(每个视频的帧数)
    • batch_size:1(每次运行的视频数量)

    Wan 2.1

3.3 Wan 2.1 的高级优化

  • 内存优化:
    • 使用 Wan 2.1 1.3B 模型以更低的 VRAM 需求实现更快的生成。
    • 降低分辨率(例如 512x320)以加快处理速度。
    • 减少帧数以实现更短更快的渲染。
  • 质量优化:
    • 使用 Wan 2.1 14B 模型以获得更高质量的输出。
    • 将 KSampler 步骤增加到 30-40 以获得更精细的结果。
    • 使用高质量的基础图像进行图像到视频以获得最佳保真度。

更多信息

有关 Wan 2.1 的更多详细信息,请访问

致谢

Wan 2.1 模型由 Wan 团队开发,ComfyUI 集成由原始开发者创建。所有功劳归于这些创新者,他们推动了 AI 驱动的视频生成的发展。

想要更多 ComfyUI 工作流吗?

RunComfy
版权 2025 RunComfy. 保留所有权利。

RunComfy 是首选的 ComfyUI 平台,提供 ComfyUI 在线 环境和服务,以及 ComfyUI 工作流 具有惊艳的视觉效果。 RunComfy还提供 AI Playground, 帮助艺术家利用最新的AI工具创作出令人惊叹的艺术作品。