ComfyUI>工作流>角色 & 姿势 & 背景替换 V3 | Wan2.2 Animate + SAM3.1 + SDPose

角色 & 姿势 & 背景替换 V3 | Wan2.2 Animate + SAM3.1 + SDPose

Workflow Name: RunComfy/Character-Pose-Background-Replacement-V3
Workflow ID: 0000...1421
此高级工作流帮助您通过替换角色、调整姿势和再生背景以受控逼真度重新构想您的视频。它由 Wan2.2 Animate、SAM3.1 分割和 SDPose 构建,为您提供完整的创意灵活性,实现无缝运动转移。您可以在保持自然动态的同时调整姿势,并在保持构图的同时刷新整个场景。其集成工具确保帧之间的一致运动和照明。对于寻求高效多层视频定制的设计师来说,这是一种理想工具,具有简单的控制。
This workflow requires a '2X Large or larger' machine to run successfully. Smaller machines may crash ComfyUI due to OOM.

ComfyUI Character & Pose & Background Replacement V3 Workflow

Character & Pose & Background Replacement V3 ComfyUI | Pose, Character, Background Swap
Want to run this workflow?
  • Fully operational workflows
  • No missing nodes or models
  • No manual setups required
  • Features stunning visuals

ComfyUI Character & Pose & Background Replacement V3 Examples

角色 & 姿势 & 背景替换 V3 — Wan2.2 Animate 视频角色替换、姿势转移和背景控制#

此 ComfyUI 工作流将源运动片段和单个参考图像转换为一个新视频,其中角色身份、姿势和背景都在您的控制之下。角色 & 姿势 & 背景替换 V3 在交换主体、转移身体和面部行为以及可选替换或混合场景的同时保持源运动结构稳定。

专为需要快速指导管道的创作者设计,它将 Wan2.2 Animate 与 SAM 3.1 分割和 SDPose 配对,以实现强大的人员遮罩和姿势指导。您可以在一个画布中使用它进行角色替换、姿势转移动画或全场景刷新,配备实用的切换和预览。

ComfyUI 角色 & 姿势 & 背景替换 V3 工作流中的关键模型#

  • Wan2.2 Animate 14B。生成视频的主干,它根据图像、姿势和文本指导渲染最终帧。支持图像条件和 LoRA 适配器用于风格或重光控制。 Model card
  • SAM 3.1。用于从帧或参考图像中提取或优化人物遮罩的高质量分割模型,驱动干净的合成和修补。 Checkpoints
  • SDPose。用于创建精确姿势图和面部裁剪的全身关键点提取和绘图工具包,指导运动和表情转移。它还提供了此图中使用的 RT-DETR 检测权重。 Repository
  • ViTPose-L WholeBody ONNX。由预处理节点用于密集身体、手部和面部标志的强大多人物关键点估计器。 Checkpoint

如何使用 ComfyUI 角色 & 姿势 & 背景替换 V3 工作流#

工作流有三个支柱:指导建设、背景控制和渲染。指导来自您的身份静态图像以及从运动片段中提取的姿势和面部信号。背景控制提供三种可互换模式。渲染使用 Wan2.2 Animate 和可选 LoRAs,然后导出一个准备分享的视频。

图像加载#

在图像加载组中加载您的身份或目标角色图像。它会根据模型调整大小并进行快速检查预览。此图像为角色 & 姿势 & 背景替换 V3 设置外观,而运动则来自源片段。如果图像主体干净,结果将更可靠地跟踪身份。

视频加载#

使用 VHS_LoadVideo (#63) 在视频加载组中导入运动源。节点暴露帧率和总帧数以进行下游调度,并确定渲染器将生成多少帧。如果提供音频,则通过到最终导出。使用文件小部件进行修剪或子采样,以便您想要更短的预览。

面部和姿势区域#

面部和姿势区域构建两个关键的指导流。它检测人物和面部,然后使用 SDPoseKeypointExtractor (#690) 提取全身关键点,并通过 SDPoseDrawKeypoints (#688) 将其绘制到干净的控制图像中。类似 RTDETR_detect (#771) 的辅助检测器和预处理加载器提供了用于身体和面部的稳健框。对于多人物镜头,切换“多人物检测”控制和“检测源”开关,以选择是否在源或背景替换分支上检测姿势。

SAM 3.1 遮罩和优化#

Sam3.1 遮罩组使用 SAM3_Detect (#753) 创建主体遮罩。您可以通过 CLIPTextEncode (#754) 使用文本引导,并通过点击使用 PointsEditor (#758) 进行选择微调。然后两个优化器使得磨砂生产就绪:GrowMaskWithBlur (#502) 轻柔地扩展和羽化边缘,BlockifyMask (#401) 平滑块边界以避免锯齿状轮廓。实时叠加预览 (DrawMaskOnImage (#391)) 帮助您在渲染前确认剪切。

背景替换区域#

您可以:

  • 保留原始场景。
  • 使用 LoadImage (#785) 替换为静态照片。
  • 使用 VHS_LoadVideo (#790) 替换为动态视频。

简单的切换选择行为,并将您选择的分支调整为与运动帧匹配,然后与人物遮罩合成。如果您需要平整的颜色舞台外观,绿屏子组提供了一个在帧之间保持稳定的实心背景。

Uni3C 运动选项#

对于需要额外相机漂移或运动平滑的镜头,Uni3C 组加载控制模型,并通过 WanVideoUni3C_ControlnetLoader (#538) 和 WanVideoUni3C_embeds (#546) 将调整大小的源片段转化为运动嵌入。强度控制和开始或结束调度允许您在序列中淡入或淡出效果。

角色替换 - 嵌入阶段#

WanVideoAnimateEmbeds (#62) 融合一切用于角色替换路径:VAE、CLIP-Vision 图像特征、您的身份图像、SDPose 姿势图、可选面部裁剪、人物遮罩和可选背景引导。宽度、高度和帧数继承自视频,因此运动对齐保持精确。当您希望新主体与原始演员完全一样运动时,请使用此模式。

运动转移 - 嵌入阶段#

第二个 WanVideoAnimateEmbeds (#904) 提供了一个以运动转移为主的路径,当您只需要将姿势和表情应用于图像主体时,它省去了背景和遮罩。一次只能激活一个嵌入阶段。选择与您的目标匹配的模式,然后上游的 Any-Switch 将选定的嵌入转发。

采样区和 LoRA 控制#

WanVideoSamplerSettings (#530) 将 Wan2.2 模型、选定的图像嵌入、可选文本嵌入、Uni3C 运动嵌入和您的种子结合在一起。使用 WanVideoLoraSelectMulti (#467) 选择 LoRA 堆栈,并由 WanVideoSetLoRAs (#48) 应用,这对重光、风格或稳定性有用。WanVideoSamplerFromSettings (#531) 生成潜在视频,WanVideoDecode (#28) 将其转换为帧。

预览和导出#

预览区播放中间帧以进行检查,VHS_VideoCombine (#312) 将最终剪辑写入您选择的帧率,并可选地传递音频。已配置的文件名前缀宏可确保每次渲染都带有时间戳。

ComfyUI 角色 & 姿势 & 背景替换 V3 工作流中的关键节点#

WanVideoAnimateEmbeds (#62, #904) 这是 Wan2.2 Animate docs 指导组装的核心。它将外观、姿势、遮罩和可选背景合并为单一图像嵌入流,调整为您的视频大小。只调节重要的:增加 pose_strength 以更紧密地锁定源运动,或在身份和唇部区域应更紧密跟踪时提高 face_strength。保持 num_frames 和视频加载器的帧数对齐以避免截断。

SAM3_Detect (#753) 使用 SAM 3.1 checkpoints 生成人物磨砂。使用提示条件或点点击当衣物与背景融合时。如果磨砂噪声很大,在优化之前使用检测工具的边界框减少选择范围。

GrowMaskWithBlur (#502) 和 BlockifyMask (#401) 来自 KJNodes repo,这些准备遮罩以实现干净的合成。增长和模糊将在背景替换后隐藏边缘接缝,而块化避免主体轮廓上的阶梯状伪影。轻微调整并经常预览。

WanVideoLoraSelectMulti (#467) 和 WanVideoSetLoRAs (#48) 这些节点在 Wan2.2 Animate wrapper 内部连接 LoRA 适配器。使用它们进行重光、奖励或运动感调整。与您的 cfg 和采样器步骤保持总强度平衡,以便 LoRAs 指导而不是压倒一切。

WanVideoUni3C_ControlnetLoader (#538) 和 WanVideoUni3C_embeds (#546) 在相同采样器 docs 内提供可选的相机和运动重定向。使用强度和开始或结束调度来混合效果。对于非常紧密的跟踪镜头,设置较低的强度以保持主体运动为主要。

VHS_VideoCombine (#312) 来自 Video Helper Suite repo。它将帧组合成最终视频,并可以从源中合成音频。在此处将帧速率与加载器的强制速率匹配以实现 1:1 的时间同步。

可选额外功能#

  • 如果在高分辨率或长片段中看到内存压力,请在编码或解码节点上启用 VAE 平铺,并在采样器设置中降低上下文大小。
  • 当主体边缘看起来锯齿状时,稍微增加遮罩增长,然后在再次渲染前调整块大小。
  • 如果替换后颜色或曝光漂移,请尝试以适度的强度使用重光 LoRA,而不是提高 CFG。
  • 对于繁忙的场景,首先在源分支上检测姿势,然后仅在遮罩可靠后切换检测到替换分支。
  • 为了稳定长时间渲染,在迭代遮罩和 LoRAs 时保持固定的 seed,然后在外观锁定后随机化。

此工作流围绕 Wan2.2 Animate 及其预处理配套工具构建,附有官方参考以供进一步阅读:Wan2.2 AnimateComfyUI-WanVideoWrapperComfyUI-WanAnimatePreprocessSAM 3.1SDPoseKJNodes

致谢#

此工作流实现并基于以下作品和资源构建。我们感谢 RunningHub 提供的工作流参考,Wan-AI 提供的 Wan2.2-Animate-14B 模型,kijai 提供的 ComfyUI WanVideoWrapper 和 WanAnimatePreprocess 节点,以及 Comfy-Org 提供的 SAM3.1 和 SDPose 模型的贡献和维护。如需权威细节,请参阅下方链接的原始文档和存储库。

资源#

注意:使用引用的模型、数据集和代码需遵守其作者和维护者提供的相关许可证和条款。

RunComfy
版权 2026 RunComfy. 保留所有权利。

RunComfy 是首选的 ComfyUI 平台,提供 ComfyUI 在线 环境和服务,以及 ComfyUI 工作流 具有惊艳的视觉效果。 RunComfy还提供 AI Models, 帮助艺术家利用最新的AI工具创作出令人惊叹的艺术作品。