Wan2.2 VACE Fun in ComfyUI | 图像动画工作流程

ComfyUI Wan2.2 VACE Fun 工作流程

Wan2.2 VACE Fun in ComfyUI | Image Animation Workflow

想要运行这个工作流吗？

完全可操作的工作流
没有缺失的节点或模型
无需手动设置
具有惊艳的视觉效果

ComfyUI Wan2.2 VACE Fun 示例

Wan2.2 VACE Fun: 在ComfyUI中将参考图像转为动画视频#

Wan2.2 VACE Fun是一个创新的、由提示驱动的参考到视频工作流程，适用于ComfyUI。提供单个参考图像和文本描述，图形将您的主体动画化为连贯的视频，同时保留身份和风格。基于Wan 2.2 VACE模块和分阶段采样器构建，平衡运动、保真度和运行时间，非常适合概念短片、角色测试和短故事片段。

此ComfyUI Wan2.2 VACE Fun工作流程专注于三件事：从参考图像中强烈遵循主体，通过您的提示引导的表现性运动，以及可靠导出为MP4视频。当您需要快速迭代但仍然有电影感时，或者当您想将静态图像转换为动态场景而无需复杂的关键帧时，请使用它。

Comfyui Wan2.2 VACE Fun工作流程中的关键模型#

Alibaba PAI Wan 2.2 VACE Fun A14B。VACE模块是将参考图像和提示转为视频就绪潜在序列的核心。它专为主体驱动的动画和身份保留而设计。Model card
Wan 2.2 Text-to-Video A14B (HIGH/LOW)。工作流程使用HIGH和LOW变体在分阶段去噪管道中交换速度和细节，以在每个地方都能有效。适用于ComfyUI的打包权重可在此处获得：Comfy-Org/Wan_2.2_ComfyUI_Repackaged
UMT5-XXL文本编码器。Wan 2.x使用的大型多语言文本编码器，用于提示理解；它支持丰富的英语和中文提示。在此处查看重新打包的文本编码器：Comfy-Org/Wan_2.2_ComfyUI_Repackaged
Wan 2.1 VAE。用于将最终视频潜在变量解码为RGB帧再编码。可在同一重新打包中获得：Comfy-Org/Wan_2.2_ComfyUI_Repackaged

如何使用Comfyui Wan2.2 VACE Fun工作流程#

工作流程分阶段运行：您设置全局控制，准备参考图像，编写提示，生成VACE条件的潜在视频，通过分阶段采样进行优化，然后解码和导出。组被组织得井然有序，您可以从上到下工作，几乎没有摩擦。

设置#

此组集中控制其余图形读取的内容：width、height、length（帧）、fps、steps、sampling_shift和seed。更改这些内容一次，每个下游节点都会通过SetNode/GetNode对获取这些值。分辨率和长度会影响质量和VRAM，而fps控制最终MP4中感知的运动。保持width和height与您的参考图像对齐以避免拉伸。种子暴露以便在运行之间实现可重现性。

Ref Img#

使用LoadImage（#118）加载您的主体，然后在ImageResizeKJv2（#112）中将图像调整为与目标分辨率匹配。RMBG（#73）移除背景，以便VACE更可靠地锁定前景主体，帮助跨帧保持身份一致性。预览节点让您在生成前快速检查剪切。处理后的图像被存储为参考并向下游提供。

提示#

提示使用UMT5-XXL编码器通过CLIP Text Encode (Positive Prompt)（#56）和CLIP Text Encode (Negative Prompt)（#54）进行编码。在正面提示中编写清晰的动作动词、相机语言和场景背景以引导运动和构图。使用负面提示抑制不需要的伪影、风格或杂乱；多语言措辞效果良好。输出为VACE步骤和后续采样器提供丰富的条件。

模型#

图形加载Wan 2.2 T2V A14B权重并应用Wan2.2 VACE Fun模块，然后增强注意力和调度以实现稳定性。HIGH分支通过PathchSageAttentionKJ（#8）和ModelSamplingSD3（#57），而LOW分支使用LoraLoaderModelOnly（#61）、PathchSageAttentionKJ（#66）和ModelSamplingSD3（#20）。这种拆分为您提供了细节优先的早期通行证和以运动为重点的优化。所有模型选择都是预先连接的；设置和提示准备好后，您只需运行图形即可。

VACE条件#

WanVaceToVideo（#43）注入您的reference_image、正面/负面条件和VAE，然后生成由width、height和length确定的初始视频潜在序列。可以将其视为静态图像根据您的提示“学习”移动的时刻。节点返回供重用的条件流和用于潜在修剪的整数，以保持管道帧一致性。除非您想尝试，否则不需要手动蒙版或控制视频。

采样#

三阶段采样器堆栈塑造结果。第一通KSamplerAdvanced（#108）为整体构图和运动线索播种潜在序列。第二通KSamplerAdvanced（#107）使用相同的条件加深细节和时间稳定性，同时保留场景布局。最后一通KSamplerAdvanced（#109）在LOW变体上运行，以抛光运动并减少伪影，在速度和质量之间取得实用的平衡。TrimVideoLatent（#65）在解码之前将帧对齐到目标长度。

输出#

VAEDecode（#19）将优化的潜在变量转为RGB帧。然后VHS_VideoCombine（#69）将这些帧组合成一个MP4，使用您选择的fps，并以合理的文件名模式保存。此组经过优化以进行快速审查循环，因此您可以在不接触其余图形的情况下迭代提示、长度或分辨率。满意时，保持相同的种子以实现可重复性，或更改它以探索变体。

Comfyui Wan2.2 VACE Fun工作流程中的关键节点#

WanVaceToVideo（#43） Wan2.2 VACE Fun的核心：它将提示语义绑定到您的参考图像，并生成初始视频潜在变量。通过共享设置在此处调整width、height和length以匹配您的创意目标和VRAM预算。保持参考主体居中和光线充足，以获得最佳身份保留效果。如果运动感觉不对，请修改正面提示以强调动作、相机移动和时间词。

KSamplerAdvanced（#108, #107, #109）一个分阶段的采样器链，逐步改善构图、细节和运动流畅性。当您需要更多细节或时间稳定性时增加steps，并重用相同的seed以公平比较更改。在LOW变体上的最后一通通常会清除细微的伪影；如果结果看起来太柔软，请将一些步骤移到早期通行证。sampling_shift暴露以将进度表向运动强调或更精细的纹理推动。

RMBG（#73）自动背景移除提高了Wan2.2 VACE Fun的主体一致性，特别是在繁忙或低对比度场景中。使用高质量、非模糊的参考以最小化剪切错误。如果您想要自然背景，请在后期替换它们或在解码帧后面合成一个背景板。

TrimVideoLatent（#65）保持潜在序列与请求的length对齐。如果您延长或缩短剪辑，请让此节点处理账目；它可以防止采样器阶段之间的细微帧漂移。

VHS_VideoCombine（#69）将最终帧编码为MP4。调整frame_rate以控制相对于length（持续时间等于帧数除以fps）的剪辑持续时间。提高质量以进行最终交付或降低质量以进行快速预览；较高的质量会增加文件大小和编码时间。

可选附加功能#

从其纵横比与目标width和height匹配的参考图像开始，以避免拉伸和不必要的裁剪。
编写描述动作和相机移动的提示，而不仅仅是外观；Wan2.2 VACE Fun对诸如“walks”、“pans”、“dollies”和“whip tilt”之类的动词反应良好。
将length和fps与您的目标保持同步：较高的fps看起来更流畅，但对于相同的帧数会缩短总持续时间。
如果身份不稳定，通过RMBG简化背景，并在提示中添加简短的身份说明（服装、颜色或装备）。
对于更快的草稿，降低分辨率或步骤，然后在最终版本中恢复它们；保持相同的种子以可靠地比较版本。

致谢#

此工作流程实施并构建在以下作品和资源之上。我们对@BenjisAIPlayground的“Wan2.2 VACE Fun Demo”工作流程及其贡献和维护表示诚挚的感谢。有关权威详细信息，请参阅下面链接的原始文档和存储库。

资源#

PWan2.2 VACE Fun Demo
- Docs / Release Notes @BenjisAIPlayground: YouTube

注意：使用所引用的模型、数据集和代码需遵循其作者和维护者提供的各自许可证和条款。

Want More ComfyUI Workflows?

Wan 2.2 FLF2V | 首尾帧视频生成

使用 Wan 2.2 FLF2V 从起始和结束帧生成流畅视频。

Wan 2.2 + Lightx2v V2 | 超快速 I2V & T2V

双 Light LoRA 设置，速度提高 4 倍。

Wan FusionX | T2V+I2V+VACE 完整

迄今为止最强大的视频生成解决方案！影院级细节，您的个人电影工作室。

Flux Consistent Characters | Input Image

使用您的图像创建一致的角色，并确保它们看起来统一。

音频反应舞者进化

使用复杂几何图形制作的音频反应背景来转换你的主题。

Stable Video Infinity 2.0 | 长篇视频生成器

轻松创建长篇、流畅、故事驱动的 AI 视频。

Flux Kontext 360 Degree LoRA

生成具有深度和空间控制的沉浸式 360 风格图像。

Hallo2 | 唇同步肖像动画

4K肖像动画的音频驱动唇同步。

关注我们

支持

资源

法律

RunComfy

RunComfy 是首选的 ComfyUI 平台，提供 ComfyUI 在线环境和服务，以及 ComfyUI 工作流具有惊艳的视觉效果。 RunComfy还提供 AI Models, 帮助艺术家利用最新的AI工具创作出令人惊叹的艺术作品。

Wan2.2 VACE Fun | 图像到动画视频