logo
RunComfy
ComfyUIPlaygroundPricing
discord logo
ComfyUI>工作流>Wan2.2 VACE Fun | 图像到动画视频

Wan2.2 VACE Fun | 图像到动画视频

Workflow Name: RunComfy/Wan2.2-VACE-Fun
Workflow ID: 0000...1290
此工作流程帮助您将任何静态图像转换为由书面提示引导的动画视频。它允许您在添加富有表现力的动作或运动时保持主体身份。您可以轻松让参考照片栩栩如生,并控制主体的移动方式。专为讲故事而设计,使概念可视化更快、更具吸引力。非常适合为社交内容、演示或创意项目创建独特的动画。通过将效率与精确性相结合,即使对于复杂的想法,它也能提供可靠的结果。

Wan2.2 VACE Fun: 在ComfyUI中将参考图像转为动画视频

Wan2.2 VACE Fun是一个创新的、由提示驱动的参考到视频工作流程,适用于ComfyUI。提供单个参考图像和文本描述,图形将您的主体动画化为连贯的视频,同时保留身份和风格。基于Wan 2.2 VACE模块和分阶段采样器构建,平衡运动、保真度和运行时间,非常适合概念短片、角色测试和短故事片段。

此ComfyUI Wan2.2 VACE Fun工作流程专注于三件事:从参考图像中强烈遵循主体,通过您的提示引导的表现性运动,以及可靠导出为MP4视频。当您需要快速迭代但仍然有电影感时,或者当您想将静态图像转换为动态场景而无需复杂的关键帧时,请使用它。

Comfyui Wan2.2 VACE Fun工作流程中的关键模型

  • Alibaba PAI Wan 2.2 VACE Fun A14B。VACE模块是将参考图像和提示转为视频就绪潜在序列的核心。它专为主体驱动的动画和身份保留而设计。Model card
  • Wan 2.2 Text-to-Video A14B (HIGH/LOW)。工作流程使用HIGH和LOW变体在分阶段去噪管道中交换速度和细节,以在每个地方都能有效。适用于ComfyUI的打包权重可在此处获得:Comfy-Org/Wan_2.2_ComfyUI_Repackaged
  • UMT5-XXL文本编码器。Wan 2.x使用的大型多语言文本编码器,用于提示理解;它支持丰富的英语和中文提示。在此处查看重新打包的文本编码器:Comfy-Org/Wan_2.2_ComfyUI_Repackaged
  • Wan 2.1 VAE。用于将最终视频潜在变量解码为RGB帧再编码。可在同一重新打包中获得:Comfy-Org/Wan_2.2_ComfyUI_Repackaged

如何使用Comfyui Wan2.2 VACE Fun工作流程

工作流程分阶段运行:您设置全局控制,准备参考图像,编写提示,生成VACE条件的潜在视频,通过分阶段采样进行优化,然后解码和导出。组被组织得井然有序,您可以从上到下工作,几乎没有摩擦。

设置

此组集中控制其余图形读取的内容:width、height、length(帧)、fps、steps、sampling_shift和seed。更改这些内容一次,每个下游节点都会通过SetNode/GetNode对获取这些值。分辨率和长度会影响质量和VRAM,而fps控制最终MP4中感知的运动。保持width和height与您的参考图像对齐以避免拉伸。种子暴露以便在运行之间实现可重现性。

Ref Img

使用LoadImage(#118)加载您的主体,然后在ImageResizeKJv2(#112)中将图像调整为与目标分辨率匹配。RMBG(#73)移除背景,以便VACE更可靠地锁定前景主体,帮助跨帧保持身份一致性。预览节点让您在生成前快速检查剪切。处理后的图像被存储为参考并向下游提供。

提示

提示使用UMT5-XXL编码器通过CLIP Text Encode (Positive Prompt)(#56)和CLIP Text Encode (Negative Prompt)(#54)进行编码。在正面提示中编写清晰的动作动词、相机语言和场景背景以引导运动和构图。使用负面提示抑制不需要的伪影、风格或杂乱;多语言措辞效果良好。输出为VACE步骤和后续采样器提供丰富的条件。

模型

图形加载Wan 2.2 T2V A14B权重并应用Wan2.2 VACE Fun模块,然后增强注意力和调度以实现稳定性。HIGH分支通过PathchSageAttentionKJ(#8)和ModelSamplingSD3(#57),而LOW分支使用LoraLoaderModelOnly(#61)、PathchSageAttentionKJ(#66)和ModelSamplingSD3(#20)。这种拆分为您提供了细节优先的早期通行证和以运动为重点的优化。所有模型选择都是预先连接的;设置和提示准备好后,您只需运行图形即可。

VACE条件

WanVaceToVideo(#43)注入您的reference_image、正面/负面条件和VAE,然后生成由width、height和length确定的初始视频潜在序列。可以将其视为静态图像根据您的提示“学习”移动的时刻。节点返回供重用的条件流和用于潜在修剪的整数,以保持管道帧一致性。除非您想尝试,否则不需要手动蒙版或控制视频。

采样

三阶段采样器堆栈塑造结果。第一通KSamplerAdvanced(#108)为整体构图和运动线索播种潜在序列。第二通KSamplerAdvanced(#107)使用相同的条件加深细节和时间稳定性,同时保留场景布局。最后一通KSamplerAdvanced(#109)在LOW变体上运行,以抛光运动并减少伪影,在速度和质量之间取得实用的平衡。TrimVideoLatent(#65)在解码之前将帧对齐到目标长度。

输出

VAEDecode(#19)将优化的潜在变量转为RGB帧。然后VHS_VideoCombine(#69)将这些帧组合成一个MP4,使用您选择的fps,并以合理的文件名模式保存。此组经过优化以进行快速审查循环,因此您可以在不接触其余图形的情况下迭代提示、长度或分辨率。满意时,保持相同的种子以实现可重复性,或更改它以探索变体。

Comfyui Wan2.2 VACE Fun工作流程中的关键节点

WanVaceToVideo(#43)
Wan2.2 VACE Fun的核心:它将提示语义绑定到您的参考图像,并生成初始视频潜在变量。通过共享设置在此处调整width、height和length以匹配您的创意目标和VRAM预算。保持参考主体居中和光线充足,以获得最佳身份保留效果。如果运动感觉不对,请修改正面提示以强调动作、相机移动和时间词。

KSamplerAdvanced(#108, #107, #109)
一个分阶段的采样器链,逐步改善构图、细节和运动流畅性。当您需要更多细节或时间稳定性时增加steps,并重用相同的seed以公平比较更改。在LOW变体上的最后一通通常会清除细微的伪影;如果结果看起来太柔软,请将一些步骤移到早期通行证。sampling_shift暴露以将进度表向运动强调或更精细的纹理推动。

RMBG(#73)
自动背景移除提高了Wan2.2 VACE Fun的主体一致性,特别是在繁忙或低对比度场景中。使用高质量、非模糊的参考以最小化剪切错误。如果您想要自然背景,请在后期替换它们或在解码帧后面合成一个背景板。

TrimVideoLatent(#65)
保持潜在序列与请求的length对齐。如果您延长或缩短剪辑,请让此节点处理账目;它可以防止采样器阶段之间的细微帧漂移。

VHS_VideoCombine(#69)
将最终帧编码为MP4。调整frame_rate以控制相对于length(持续时间等于帧数除以fps)的剪辑持续时间。提高质量以进行最终交付或降低质量以进行快速预览;较高的质量会增加文件大小和编码时间。

可选附加功能

  • 从其纵横比与目标width和height匹配的参考图像开始,以避免拉伸和不必要的裁剪。
  • 编写描述动作和相机移动的提示,而不仅仅是外观;Wan2.2 VACE Fun对诸如“walks”、“pans”、“dollies”和“whip tilt”之类的动词反应良好。
  • 将length和fps与您的目标保持同步:较高的fps看起来更流畅,但对于相同的帧数会缩短总持续时间。
  • 如果身份不稳定,通过RMBG简化背景,并在提示中添加简短的身份说明(服装、颜色或装备)。
  • 对于更快的草稿,降低分辨率或步骤,然后在最终版本中恢复它们;保持相同的种子以可靠地比较版本。

致谢

此工作流程实施并构建在以下作品和资源之上。我们对@BenjisAIPlayground的“Wan2.2 VACE Fun Demo”工作流程及其贡献和维护表示诚挚的感谢。有关权威详细信息,请参阅下面链接的原始文档和存储库。

资源

  • PWan2.2 VACE Fun Demo
    • Docs / Release Notes @BenjisAIPlayground: YouTube

注意:使用所引用的模型、数据集和代码需遵循其作者和维护者提供的各自许可证和条款。

Want More ComfyUI Workflows?

Wan 2.2 FLF2V | 首尾帧视频生成

使用 Wan 2.2 FLF2V 从起始和结束帧生成流畅视频。

Wan 2.2 + Lightx2v V2 | 超快速 I2V & T2V

双 Light LoRA 设置,速度提高 4 倍。

Wan FusionX | T2V+I2V+VACE 完整

迄今为止最强大的视频生成解决方案!影院级细节,您的个人电影工作室。

Flux Consistent Characters | Input Image

Flux Consistent Characters | Input Image

使用您的图像创建一致的角色,并确保它们看起来统一。

音频反应舞者进化

使用复杂几何图形制作的音频反应背景来转换你的主题。

AnimateDiff + ControlNet + IPAdapter V1 | 扁平动漫风格

轻松地为您的视频赋予独特的动漫风格,捕捉充满活力的扁平风格

AnimateDiff + ControlNet | 卡通风格

通过将视频转换为生动的卡通,为您的视频增添趣味。

Consistent Character Creator 3.0 | 简单一致性,任意角度

让角色保持相同,每个角度都强壮完美。

关注我们
  • 领英
  • Facebook
  • Instagram
  • Twitter
支持
  • Discord
  • 电子邮件
  • 系统状态
  • 附属
资源
  • 免费 ComfyUI 在线版
  • ComfyUI 指南
  • RunComfy API
  • ComfyUI 教程
  • ComfyUI 节点
  • 了解更多
法律
  • 服务条款
  • 隐私政策
  • Cookie 政策
RunComfy
版权 2025 RunComfy. 保留所有权利。

RunComfy 是首选的 ComfyUI 平台,提供 ComfyUI 在线 环境和服务,以及 ComfyUI 工作流 具有惊艳的视觉效果。 RunComfy还提供 AI Playground, 帮助艺术家利用最新的AI工具创作出令人惊叹的艺术作品。