WAN 2.2 Smooth Workflow v5.0:一个用于流畅5秒视频的全功能 ComfyUI 管道#
WAN 2.2 Smooth Workflow v5.0 是一个涵盖文本到视频、图像到视频、首尾帧动画和音频到视频的单一画布。它围绕 SmoothMix WAN 2.2 模型家族构建,配有可选的 Lightx2v LoRAs、WAN 2.x 的 WanVideoWrapper 操作符和 RIFE 帧插值,因此您可以生成运动一致且快速迭代的短电影剪辑。
使用这个 WAN 2.2 Smooth Workflow v5.0,当您需要一个有组织的图形,可以在不重新连接节点的情况下在 T2V、I2V、F2LF 和 A2V 之间切换。画布包括模式切换、持续时间和尺寸控制、最后一帧预览以及一个可选的音频分支,可以跟随剪辑的视觉节奏。
Comfyui WAN 2.2 Smooth Workflow v5.0 的关键模型#
- SmoothMix WAN 2.2 文本到视频和图像到视频检查点(高和低)
- 角色:主要的扩散主干,用于在 T2V 和 I2V 路径上的运动合成和精炼。高质量注重细节和质量;低质量注重速度和 VRAM 空间。
- Lightx2v WAN 2.2 Distill LoRAs
- 角色:WAN 2.2 的可选 LoRAs,增强运动流畅性或风格化,同时保持提示响应。根据需要加载以引导外观和动态。lightx2v/Wan2.2-Distill-Loras
- WAN 2.x VAE
- 角色:贯穿整个画布的 VAE,用于编码和解码视频潜变量,以确保图像质量和颜色响应在各个分支中保持一致。
- WAN 2.x 文本编码器(uMT5 XXL 家族)
- 角色:由 WAN 2.x 使用的专用文本编码器;工作流程加载匹配的分词器/模型,以便提示正确地调节运动和外观。
- CLIP Vision 编码器(ViT‑H 家族)
- 角色:提取首尾帧动画路径的强大起始和结束帧嵌入,提高插值期间的时间一致性。
- 音频生成分支
- 角色:可选的帧感知音频合成,基于视觉时间和文本提示创建与视觉剪辑对齐的音轨元素。
- RIFE 视频插值
- 角色:通过插入高质量的中间帧来提高时间流畅性和表观帧率,非常适合短电影循环。通过 ComfyUI VFI 集成使用。GACLove/ComfyUI-VFI
如何使用 Comfyui WAN 2.2 Smooth Workflow v5.0#
画布分为四种生产模式,您可以从画布上的开关启用。各模式中,您将看到一致的组,用于检查点、CLIP/VAE、提示、视频尺寸和长度、采样和视频结果。每种模式可以通过音频启用开关选择性地启用音频生成。
文本到视频 (T2V)#
在正面提示中输入您的描述,并通过负面提示进行细化。提示文本在 CLIPTextEncode (#90) 中编码,并与 WAN 2.x VAE 结合。即使没有起始图像,WanImageToVideo (#50) 也作为 T2V 的入口点,生成初始潜在序列,然后传递给采样器再进行解码。RIFE 插值 RIFEInterpolation (#160) 在 VHS_VideoCombine (#77) 导出 MP4 之前平滑序列。使用音频启用器从帧和音频提示生成音轨。
图像到视频 (I2V)#
在 IMAGE 组中放置单个图像,然后设置您的视频尺寸和持续时间。图像被调整大小并发送到 WanImageToVideo (#172),与您的文本提示一起生成运动感知潜在变量。配对的采样器细化潜在变量,然后结果被解码、放大和插值以获得流畅的输出。如果您希望生成与动画内容匹配的声音,请启用 I2V 音频组。
首尾帧动画 (F2LF)#
提供一个开始帧和一个结束帧。图形使用 CLIP Vision 编码这两个边界帧,并传递到 WanFirstLastFrameToVideo (#343),规划首尾图像之间的路径,同时尊重您的文本提示。高低 SmoothMix 采样器然后雕刻中间帧,再进行解码和插值。结果由 VHS_VideoCombine (#332) 导出,可选的音频分支可以合成与视觉过渡对齐的音轨。
音频到视频 (A2V)#
在 VHS_LoadVideo (#145) 中加载现有剪辑。工作流程可以选择性地对其进行插值以获得额外的流畅性,然后音频分支根据视觉和音频提示创建声音。VHS_VideoCombine (#148) 合并音轨并导出新文件。使用画布上的最后一帧预览快速检查导出前的视觉一致性。
导出和最后一帧预览#
每种模式以视频结果组结束,通过 VideoHelperSuite 的 VHS_VideoCombine 节点写入 MP4。专用的最后一帧面板保存并预览最终帧,以便您在运行完整生成之前一目了然地判断照明、颜色和主体质量。视频 I/O 和预览功能由 VideoHelperSuite 提供。pythongosssss/ComfyUI-VideoHelperSuite
Comfyui WAN 2.2 Smooth Workflow v5.0 的关键节点#
WanImageToVideo (#50)
- 这是 T2V 和 I2V 在 WanVideoWrapper 中的 WAN 2.x 视频入口点。它将您的提示与 VAE(和可选的起始图像)合并以构建初始运动潜变量。上游的尺寸和长度控制必须符合模型友好的约束,并且该节点为后续的配对采样器提供输入。WanVideoWrapper 实现详细信息和更新维护在这里:kijai/ComfyUI-WanVideoWrapper。
WanFirstLastFrameToVideo (#343)
- 通过摄取边界帧的 CLIP Vision 嵌入和您的文本提示来驱动首尾帧路径。它创建一个引导轨迹,在变形至目标时保持主体身份和场景布局。保持起始和结束帧在主体比例和构图上的一致,以获得最自然的过渡。
KSamplerWithNAG (Advanced) (#234)
- 应用噪声辅助引导以改善提示遵从性并减少短片中的时间漂移。仅当您看到过度约束或不足约束时调整其引导;它与标准采样器和您的负面提示协同工作。请参阅项目文档中的方法和调优指南:scottmudge/ComfyUI-NAG。
RIFEInterpolation (#160)
- 在编码为视频之前插入高质量的中间帧以改善运动流畅性。当您的基础序列在帧间看起来不错但在播放时感觉有点不流畅时使用。该节点集成了由 ComfyUI VFI 扩展提供的 RIFE 实现。GACLove/ComfyUI-VFI
VHS_VideoCombine (#77)
- 处理最终编码、合并可选音频和保存元数据。保持其格式和像素格式在项目之间一致,以实现可预测的播放。VideoHelperSuite 还支持画布上使用的快速最后一帧预览工具。pythongosssss/ComfyUI-VideoHelperSuite
可选附加功能#
- 使用高低 SmoothMix 检查点来平衡质量和速度。高质量适合重要镜头和最后一次迭代,低质量帮助您更快地迭代提示和时间。
- 将视频宽度和高度保持在模型友好的倍数,以最大程度减少伪影并加快采样速度。
- 如果 T2V 剪辑看起来静止,请刷新种子或在提示中加强运动动词,然后再增加采样深度。
- 对于 F2LF,选择具有相似相机角度和曝光的边界帧。构图中的大跳跃更难平滑解决。
- 画布包括一个自适应提示助手,用于在您需要快速变化而无需手动重写提示时提供更丰富的措辞。Alectriciti/comfyui-adaptiveprompts
这个 WAN 2.2 Smooth Workflow v5.0 旨在最大限度地减少模式切换摩擦,同时保持结果流畅和电影化。从匹配您的输入的模式开始,设置尺寸和持续时间,编写清晰的提示对,然后让采样器和 RIFE 完成其余的工作。
致谢#
此工作流程实现并建立在以下工作和资源的基础上。我们感谢 Civitai 创作者为 Smooth Workflow Wan 2.2 AIO 工作流程和 Smooth Mix Wan 2.2 14B I2V/T2V 模型的贡献和维护。有关权威细节,请参阅以下链接的原始文档和存储库。
资源#
- Civitai/Smooth Workflow Wan 2.2 AIO (Workflow v5.0)
- 文档 / 发布说明:工作流程来源
- Civitai/Smooth Mix Wan 2.2 14B (I2V/T2V)
- 文档 / 发布说明:SmoothMix WAN 2.2 I2V/T2V 模型
- kijai/ComfyUI-WanVideoWrapper
- GitHub: kijai/ComfyUI-WanVideoWrapper
- lightx2v/Wan2.2-Distill-Loras
- GitHub: ModelTC/LightX2V
- Hugging Face: lightx2v/Wan2.2-Distill-Loras
注意:使用引用的模型、数据集和代码须遵循其作者和维护者提供的相应许可证和条款。


