SAM 3.1 ComfyUI 工作流程 | Native Segmentation 和 Video Tracking

SAM 3.1 ComfyUI Workflow

Want to run this workflow?

Fully operational workflows
No missing nodes or models
No manual setups required
Features stunning visuals

SAM 3.1 ComfyUI Examples

SAM 3.1 ComfyUI 工作流程，用於提示引導的分割、邊界框預覽和視頻跟蹤#

此 SAM 3.1 ComfyUI 工作流程提供本地、可提示的圖像分割，具有即時邊界框可視化和幀準確的視頻物體跟蹤及遮罩提取。它使用內置的 comfy-core SAM 3.1 節點，因此您可以獲得一流的性能和穩定性，而無需第三方自定義節點。結果是快速、可重複使用的遮罩，用於合成、隔離或靜止圖像和完整視頻的下游編輯。

專為藝術家、編輯和管道工程師設計，SAM 3.1 ComfyUI 使您可以輕鬆地從文本提示或邊界框開始，當場驗證選擇，然後將乾淨的遮罩傳播到整個剪輯。它在引擎蓋下加載 sam3.1_multiplex_fp16 檢查點並運行官方的 SAM3_Detect、SAM3_VideoTrack、SAM3_TrackToMask 和 SAM3_TrackPreview 節點，這些節點作為本地支持添加到 ComfyUI。請參考 Hugging Face 上的模型文件和 ComfyUI 的 pull request 以獲取背景信息：Comfy-Org/sam3.1，ComfyUI PR #13408。

Comfyui SAM 3.1 ComfyUI 工作流程中的關鍵模型#

Comfy-Org SAM 3.1 Multiplex FP16 檢查點。sam3.1_multiplex_fp16 權重驅動可提示的圖像分割和 SAM 3.1 節點使用的跟蹤器。用 CheckpointLoaderSimple 加載它，並提供整個工作流程中使用的模型和文本調節。來源：Comfy-Org/sam3.1。

如何使用 Comfyui SAM 3.1 ComfyUI 工作流程#

圖形有兩個獨立的通道。圖像遮罩允許您分割靜止圖像並預覽邊界框以進行快速質量檢查。視頻遮罩在參考幀上初始化遮罩，跟蹤整個剪輯中的物體，預覽跟蹤並導出遮罩以進行編輯或合成。

圖像遮罩#

此通道非常適合單幀或在運行跟蹤之前對提示進行原型設計。首先使用 LoadImage (#4) 加載圖像，並在 CLIPTextEncode (#3) 中編寫簡短的文本提示，例如“a bird”或“red car”。文本調節和圖像被饋送到 SAM3_Detect (#1)，它返回遮罩和自動邊界框。使用 MaskPreview+ (#5) 來視覺檢查遮罩，並使用 DrawBBoxes (#6) 加上 PreviewImage (#7) 來確認框的位置。如果選擇不明確，請細化文本，添加正面或負面點，或提供更緊密的框以引導 SAM 3.1 ComfyUI 朝向預期的物體。

視頻遮罩#

此通道將相同的可提示分割擴展到整個剪輯。在 VHS_LoadVideoPath (#12) 中加載視頻；它將幀和元數據提供給圖形的其餘部分。使用 ImageFromBatch (#15) 選擇一個參考幀，並通過 CLIPTextEncode (#14) 用文本描述。SAM3_Detect (#13) 在該幀上生成初始遮罩，這作為 SAM3_VideoTrack (#8) 使用相同的模型和文本調節跟蹤剩餘幀中的物體的種子。使用 SAM3_TrackToMask (#9) 將結果跟蹤轉換為每幀遮罩。為了快速的二元預覽或反轉前景/背景，遮罩通過 InvertMask (#19) 和 MaskToImage (#16)，然後 VHS_VideoCombine (#17) 可以渲染簡單的遮罩視頻。要在原始幀上交互查看結果，SAM3_TrackPreview (#10) 以 VHS_VideoInfoLoaded (#18) 提供的源幀率播放覆蓋。調整起始幀或提示如果看到漂移，然後重新運行以在導出前鎖定跟蹤。

Comfyui SAM 3.1 ComfyUI 工作流程中的關鍵節點#

`SAM3_Detect` (#1)#

根據您的提示和可選的點或框生成靜止圖像的物體遮罩和邊界框。使用它可以快速驗證您的主題選擇。如果遮罩感覺過於寬泛或包括相似物，請收緊文本描述或繪製更受約束的框以改善分離。

`SAM3_Detect` (#13)#

通過在選定的參考幀上生成乾淨的遮罩來啟動視頻跟蹤器。SAM 3.1 ComfyUI 中的跟蹤質量很大程度上取決於此種子，因此請選擇一個目標可見且遮擋最小的幀。如果主題後來出現變化，請從另一幀重新初始化並在編輯器中連接結果。

`SAM3_VideoTrack` (#8)#

使用相同的模型和文本提示在剪輯中傳播初始遮罩。保持調節與種子一致，以避免附著在類似物體上。當跟蹤小型或快速移動的物體時，從具有信心種子的幀開始，如果光照或比例劇烈變化，請考慮縮短段。

`SAM3_TrackToMask` (#9)#

將跟蹤器輸出轉換為遮罩序列以便導出。您可以輸出所有幀或通過輸入索引或簡單範圍選擇子集。這是要么寫入視頻預覽，要么將 PNG 序列保存到您首選工具中的合成的交接點。

`SAM3_TrackPreview` (#10)#

在原始幀上播放跟蹤結果以進行即時質量控制。預覽使用 VHS_VideoInfoLoaded (#18) 報告的源幀率，因此時間與您的剪輯匹配。在提交完整導出之前，使用它來檢查漂移、遮擋失敗或身份交換。

可選附加功能#

使用邊界框在文本提示匹配幀中的多個主題時進行消歧。
如果目標在剪輯中途改變比例或光照，將視頻拆分為邏輯段，並為每個段重新播種 SAM3_Detect (#13) 以獲得更穩定的跟蹤。
對於作為圖像序列的遮罩導出，將 SAM3_TrackToMask (#9) 路由到 SaveImage 節點，而不是 VHS_VideoCombine (#17)。
保持提示簡短且具體。在 SAM 3.1 ComfyUI 中，具有關鍵屬性的簡潔名詞通常比冗長的散文表現更好。
當您只需要特定幀的靜止遮罩時，直接在該幀上運行圖像遮罩以繞過跟蹤並節省時間。

感謝#

此工作流程實施並建立在以下工作和資源之上。我們衷心感謝 Innovate Futures @ Benji 提供的 ComfyUI 與 SAM 3.1 分割工作流程，Comfy-Org 提供的 SAM 3.1 模型文件，以及 Comfy-Org 提供的 Native ComfyUI SAM 3.1 支持 PR 的貢獻和維護。有關權威詳細信息，請參閱以下鏈接的原始文檔和存儲庫。

資源#

Innovate Futures @ Benji/工作流程來源
- 文檔 / 發布說明：ComfyUI With SAM 3.1 Segmentation Native Support! No Custom Node Needed @Benji's AI Playground
Comfy-Org/SAM 3.1 模型文件
- GitHub: facebookresearch/sam3
- Hugging Face: Comfy-Org/sam3.1
- arXiv: SAM 3: Segment Anything with Concepts (2511.16719)
- 文檔 / 發布說明：RELEASE_SAM3p1.md
Comfy-Org/Native ComfyUI SAM 3.1 支持 PR
- GitHub: Comfy-Org/ComfyUI#13408

注意：使用參考的模型、數據集和代碼需遵循其作者和維護者提供的各自許可和條款。

Want More ComfyUI Workflows?

ComfyUI Grounding | 物件追蹤工作流程

以像素級精準度追蹤任何主體，實現驚人的視覺效果。

Segment Anything V2 (SAM2) | 影片分割

影片物件分割，準確性無可比擬。

MatAnyone 影片去背 | 單一遮罩移除

使用單一遮罩幀去除影片背景，實現完美的主體隔離。

Vid2Vid 第1部分 | 組成與遮罩

ComfyUI Vid2Vid 提供兩種不同的工作流程來創建高品質、專業的動畫：Vid2Vid 第1部分，通過專注於原始視頻的組成和遮罩來增強您的創造力，以及 Vid2Vid 第2部分，利用 SDXL Style Transfer 將視頻的風格轉變為您想要的美學風格。本頁專門涵蓋 Vid2Vid 第1部分。

動態圖形動畫效果 | Vid2Vid

從現有視頻輸入開始實現動態圖形動畫效果。

HiDream E1.1 | AI 圖像編輯

使用 HiDream E1.1 模型以自然語言編輯圖像

daVinci-MagiHuman | 實景說話人類生成器

創建出與語音同步並富有表情運動的逼真化身。

Multitalk | 真實感說話影片製作器

一鍵從肖像和聲音創建多說話者同步對口型影片！

關注我們

支持

資源

法律

RunComfy

RunComfy 是首選的 ComfyUI 平台，提供 ComfyUI 在線環境和服務，以及 ComfyUI 工作流程具有驚豔的視覺效果。 RunComfy還提供 AI Models, 幫助藝術家利用最新的AI工具創作出令人驚艷的藝術作品。

SAM 3.1 ComfyUI | Native Segmentation & Tracking