此工作流将 SAM 3 引入 ComfyUI,用于快速、精确的图像和视频对象检测和分割。它专为需要可靠蒙版的艺术家和技术用户而设计,适用于 VFX、抠像、合成和 AI 辅助编辑。通过文本提示、框选择和帧到帧传播,SAM 3 提供一致的蒙版,即使在复杂场景中也能保持一致。
该图包含两个图像管道和一个视频管道。您可以通过文本描述目标,通过在目标周围绘制框,或者通过在第一个视频帧上初始化并让 SAM 3 在整个剪辑中传播蒙版来进行分割。工作流内联预览结果并保存可视化叠加和仅蒙版输出。
从概览来看,该工作流有三条通道:带语义文本提示的图像、带框提示的图像和带初始化加传播的视频。所有通道使用相同的 SAM 3 权重,并在预览和保存上收敛。
图像组通过 LoadImage (#4) 加载图片,并通过 LoadSAM3Model (#1) 加载 SAM 3 权重。从此处,图像流向两个替代的 SAM 3 分割分支,以便您可以选择最快的方式获得干净的蒙版。每个分支返回快速 QC 的可视化叠加和下游工作的二进制蒙版。需要快速单个高质量 SAM 3 蒙版时,请使用图像通道。
此路径通过语言提示进行分割。DeepTranslatorTextNode (#16) 让您可以用偏好的语言输入自然语言描述,然后路由到 SAM3Segmentation (#82)。SAM 3 解释文本并返回蒙版以及可通过 SaveImage (#23) 保存和通过 MaskPreview (#15) 检查的彩色叠加。使用简短、具体的名词以获得最佳结果,如果匹配多个对象,请通过更具体来细化。
此路径通过兴趣区域框进行分割。使用 SAM3BBoxCollector (#84) 绘制一个或多个框围绕您想要的目标,然后运行 SAM3Segmentation (#81) 通过这些框计算蒙版。您可以添加排除框以抑制附近的干扰物,从而获得更紧密的 SAM 3 蒙版。结果通过 PreviewImage (#65) 和 MaskPreview (#66) 预览,并可以导出用于合成工作。
视频组通过 VHS_LoadVideo (#75) 从 Video Helper Suite 加载剪辑,并通过 SAM3VideoModelLoader (#69) 初始化模型。使用 SAM3VideoSegmentation (#78) 在第一帧上设置初始选择,必要时通过 SAM3PointCollector (#79) 或框辅助。然后 SAM3Propagate (#77) 驱动 SAM 3 在剪辑中前后传播,以保持即使在运动和遮挡下也能保持一致的蒙版。SAM3VideoOutput (#76) 提供叠加可视化和每帧蒙版,通过 CreateVideo (#70, #74) 转换为 MP4 并通过 SaveVideo (#71, #72) 保存。当您需要用于编辑或合成的干净、时间稳定的 SAM 3 蒙版时,请使用此通道。
LoadSAM3Model (#1)
加载用于图像任务的 SAM 3 权重。如果交换权重,保持图像通道一致,以便预览和保存反映相同的 SAM 3 骨干。
SAM3Segmentation (#82)
文本驱动的图像分割。提供描述目标类别的清晰文本提示。如果检测到多个对象,请使描述更具体或运行多次以收集单独的 SAM 3 蒙版。
SAM3Segmentation (#81)
框驱动的图像分割。围绕对象绘制一个或多个紧密的框。如果蒙版溢出,使用附加框排除相邻区域,然后重新运行以优化 SAM 3 输出。
SAM3VideoModelLoader (#69)
初始化用于剪辑通道的 SAM 3 视频模型。如果计划在静止图像和视频中匹配外观,请保持与图像模型选择一致。
SAM3VideoSegmentation (#78)
使用文本、点或框在第一帧上设置初始选择。从简单的提示开始,干净地隔离主题。如果第一帧蒙版完美,传播将在视频的其余部分更容易和更快。
SAM3Propagate (#77)
在序列中传播初始蒙版。当主题快速移动、改变规模或部分遮挡时,调整其行为。如果在场景更改或剪辑后出现漂移,请在剪辑附近重新初始化并再次传播,以保持 SAM 3 结果稳定。
SAM3VideoOutput (#76)
打包传播的 SAM 3 蒙版和可视化叠加。使用叠加 MP4 逐帧检查质量,并使用仅蒙版 MP4 直接导入合成或编辑。
SAM3BBoxCollector (#84)
用于图像选择的交互式框工具。绘制紧密的正框和可选的负框,以引导 SAM 3 达到精确的边界,然后预览和迭代。
SAM3PointCollector (#79)
用于视频初始化的交互式点工具。在第一帧上添加一些位置良好的正负点击,以便在文本或框无法清晰时引导 SAM 3。
VHS_LoadVideo (#75)
来自 Video Helper Suite 的视频导入 Kosinkadink/ComfyUI-VideoHelperSuite。使用它加载剪辑,检查帧,并将图像交给 SAM 3 视频节点进行初始化和传播。
此工作流实现并构建在以下工作和资源之上。我们感谢 PozzettiAndrea 为 ComfyUI-SAM3 的贡献和维护。有关权威详细信息,请参阅下面链接的原始文档和存储库。
注意:使用引用的模型、数据集和代码需遵循其作者和维护者提供的相应许可和条款。
RunComfy 是首选的 ComfyUI 平台,提供 ComfyUI 在线 环境和服务,以及 ComfyUI 工作流 具有惊艳的视觉效果。 RunComfy还提供 AI Playground, 帮助艺术家利用最新的AI工具创作出令人惊叹的艺术作品。