logo
RunComfy
  • ComfyUI
  • TrainerNew
  • Models
  • API
  • Pricing
discord logo
ComfyUI>工作流程>SAM 3.1 ComfyUI | Native Segmentation & Tracking

SAM 3.1 ComfyUI | Native Segmentation & Tracking

Workflow Name: RunComfy/SAM-3.1-ComfyUI
Workflow ID: 0000...1407
此工作流程讓您可以以精確的準確度分割圖像並跨幀跟蹤物體。使用 comfy-core 檢測和跟蹤功能,它能夠實時預覽邊界框並提取遮罩,而無需第三方節點。您可以輕鬆隔離元素進行合成或編輯。非常適合尋求可重複使用遮罩的運動設計師、編輯和 AI 創作者。通過全面的視覺控制實現乾淨的本地集成並提高工作流程效率。

SAM 3.1 ComfyUI 工作流程,用於提示引導的分割、邊界框預覽和視頻跟蹤#

此 SAM 3.1 ComfyUI 工作流程提供本地、可提示的圖像分割,具有即時邊界框可視化和幀準確的視頻物體跟蹤及遮罩提取。它使用內置的 comfy-core SAM 3.1 節點,因此您可以獲得一流的性能和穩定性,而無需第三方自定義節點。結果是快速、可重複使用的遮罩,用於合成、隔離或靜止圖像和完整視頻的下游編輯。

專為藝術家、編輯和管道工程師設計,SAM 3.1 ComfyUI 使您可以輕鬆地從文本提示或邊界框開始,當場驗證選擇,然後將乾淨的遮罩傳播到整個剪輯。它在引擎蓋下加載 sam3.1_multiplex_fp16 檢查點並運行官方的 SAM3_Detect、SAM3_VideoTrack、SAM3_TrackToMask 和 SAM3_TrackPreview 節點,這些節點作為本地支持添加到 ComfyUI。請參考 Hugging Face 上的模型文件和 ComfyUI 的 pull request 以獲取背景信息:Comfy-Org/sam3.1,ComfyUI PR #13408。

Comfyui SAM 3.1 ComfyUI 工作流程中的關鍵模型#

  • Comfy-Org SAM 3.1 Multiplex FP16 檢查點。sam3.1_multiplex_fp16 權重驅動可提示的圖像分割和 SAM 3.1 節點使用的跟蹤器。用 CheckpointLoaderSimple 加載它,並提供整個工作流程中使用的模型和文本調節。來源:Comfy-Org/sam3.1。

如何使用 Comfyui SAM 3.1 ComfyUI 工作流程#

圖形有兩個獨立的通道。圖像遮罩允許您分割靜止圖像並預覽邊界框以進行快速質量檢查。視頻遮罩在參考幀上初始化遮罩,跟蹤整個剪輯中的物體,預覽跟蹤並導出遮罩以進行編輯或合成。

圖像遮罩#

此通道非常適合單幀或在運行跟蹤之前對提示進行原型設計。首先使用 LoadImage (#4) 加載圖像,並在 CLIPTextEncode (#3) 中編寫簡短的文本提示,例如“a bird”或“red car”。文本調節和圖像被饋送到 SAM3_Detect (#1),它返回遮罩和自動邊界框。使用 MaskPreview+ (#5) 來視覺檢查遮罩,並使用 DrawBBoxes (#6) 加上 PreviewImage (#7) 來確認框的位置。如果選擇不明確,請細化文本,添加正面或負面點,或提供更緊密的框以引導 SAM 3.1 ComfyUI 朝向預期的物體。

視頻遮罩#

此通道將相同的可提示分割擴展到整個剪輯。在 VHS_LoadVideoPath (#12) 中加載視頻;它將幀和元數據提供給圖形的其餘部分。使用 ImageFromBatch (#15) 選擇一個參考幀,並通過 CLIPTextEncode (#14) 用文本描述。SAM3_Detect (#13) 在該幀上生成初始遮罩,這作為 SAM3_VideoTrack (#8) 使用相同的模型和文本調節跟蹤剩餘幀中的物體的種子。使用 SAM3_TrackToMask (#9) 將結果跟蹤轉換為每幀遮罩。為了快速的二元預覽或反轉前景/背景,遮罩通過 InvertMask (#19) 和 MaskToImage (#16),然後 VHS_VideoCombine (#17) 可以渲染簡單的遮罩視頻。要在原始幀上交互查看結果,SAM3_TrackPreview (#10) 以 VHS_VideoInfoLoaded (#18) 提供的源幀率播放覆蓋。調整起始幀或提示如果看到漂移,然後重新運行以在導出前鎖定跟蹤。

Comfyui SAM 3.1 ComfyUI 工作流程中的關鍵節點#

SAM3_Detect (#1)#

根據您的提示和可選的點或框生成靜止圖像的物體遮罩和邊界框。使用它可以快速驗證您的主題選擇。如果遮罩感覺過於寬泛或包括相似物,請收緊文本描述或繪製更受約束的框以改善分離。

SAM3_Detect (#13)#

通過在選定的參考幀上生成乾淨的遮罩來啟動視頻跟蹤器。SAM 3.1 ComfyUI 中的跟蹤質量很大程度上取決於此種子,因此請選擇一個目標可見且遮擋最小的幀。如果主題後來出現變化,請從另一幀重新初始化並在編輯器中連接結果。

SAM3_VideoTrack (#8)#

使用相同的模型和文本提示在剪輯中傳播初始遮罩。保持調節與種子一致,以避免附著在類似物體上。當跟蹤小型或快速移動的物體時,從具有信心種子的幀開始,如果光照或比例劇烈變化,請考慮縮短段。

SAM3_TrackToMask (#9)#

將跟蹤器輸出轉換為遮罩序列以便導出。您可以輸出所有幀或通過輸入索引或簡單範圍選擇子集。這是要么寫入視頻預覽,要么將 PNG 序列保存到您首選工具中的合成的交接點。

SAM3_TrackPreview (#10)#

在原始幀上播放跟蹤結果以進行即時質量控制。預覽使用 VHS_VideoInfoLoaded (#18) 報告的源幀率,因此時間與您的剪輯匹配。在提交完整導出之前,使用它來檢查漂移、遮擋失敗或身份交換。

可選附加功能#

  • 使用邊界框在文本提示匹配幀中的多個主題時進行消歧。
  • 如果目標在剪輯中途改變比例或光照,將視頻拆分為邏輯段,並為每個段重新播種 SAM3_Detect (#13) 以獲得更穩定的跟蹤。
  • 對於作為圖像序列的遮罩導出,將 SAM3_TrackToMask (#9) 路由到 SaveImage 節點,而不是 VHS_VideoCombine (#17)。
  • 保持提示簡短且具體。在 SAM 3.1 ComfyUI 中,具有關鍵屬性的簡潔名詞通常比冗長的散文表現更好。
  • 當您只需要特定幀的靜止遮罩時,直接在該幀上運行圖像遮罩以繞過跟蹤並節省時間。

感謝#

此工作流程實施並建立在以下工作和資源之上。我們衷心感謝 Innovate Futures @ Benji 提供的 ComfyUI 與 SAM 3.1 分割工作流程,Comfy-Org 提供的 SAM 3.1 模型文件,以及 Comfy-Org 提供的 Native ComfyUI SAM 3.1 支持 PR 的貢獻和維護。有關權威詳細信息,請參閱以下鏈接的原始文檔和存儲庫。

資源#

  • Innovate Futures @ Benji/工作流程來源
    • 文檔 / 發布說明:ComfyUI With SAM 3.1 Segmentation Native Support! No Custom Node Needed @Benji's AI Playground
  • Comfy-Org/SAM 3.1 模型文件
    • GitHub: facebookresearch/sam3
    • Hugging Face: Comfy-Org/sam3.1
    • arXiv: SAM 3: Segment Anything with Concepts (2511.16719)
    • 文檔 / 發布說明:RELEASE_SAM3p1.md
  • Comfy-Org/Native ComfyUI SAM 3.1 支持 PR
    • GitHub: Comfy-Org/ComfyUI#13408

注意:使用參考的模型、數據集和代碼需遵循其作者和維護者提供的各自許可和條款。

Want More ComfyUI Workflows?

ComfyUI Grounding | 物件追蹤工作流程

以像素級精準度追蹤任何主體,實現驚人的視覺效果。

Segment Anything V2 (SAM2) | 影片分割

影片物件分割,準確性無可比擬。

MatAnyone 影片去背 | 單一遮罩移除

使用單一遮罩幀去除影片背景,實現完美的主體隔離。

Vid2Vid 第1部分 | 組成與遮罩

ComfyUI Vid2Vid 提供兩種不同的工作流程來創建高品質、專業的動畫:Vid2Vid 第1部分,通過專注於原始視頻的組成和遮罩來增強您的創造力,以及 Vid2Vid 第2部分,利用 SDXL Style Transfer 將視頻的風格轉變為您想要的美學風格。本頁專門涵蓋 Vid2Vid 第1部分。

動態圖形動畫效果 | Vid2Vid

從現有視頻輸入開始實現動態圖形動畫效果。

Capybara ComfyUI 工作流程 | 統一的圖像-視頻創建者

創建、編輯和動畫——全部在一個智能生成管道中完成。

AnimateDiff + AutoMask + ControlNet | 視覺效果 (VFX)

使用 AnimateDiff、AutoMask 和 ControlNet 增強 VFX,實現精確、可控的效果。

ControlNet Tile + 4x UltraSharp | 圖片/影片升級器

使用 ControlNet Tile、4xUltraSharp 和幀插值技術來取得高解析度的結果。

關注我們
  • 領英
  • Facebook
  • Instagram
  • Twitter
支持
  • Discord
  • 電子郵件
  • 系統狀態
  • 附屬
資源
  • 免費 ComfyUI 在線版
  • ComfyUI 指南
  • RunComfy API
  • RunComfy MCP
  • ComfyUI 教程
  • ComfyUI 節點
  • 了解更多
法律
  • 服務條款
  • 隱私政策
  • Cookie 政策
RunComfy
版權 2026 RunComfy. 保留所有權利。

RunComfy 是首選的 ComfyUI 平台,提供 ComfyUI 在線 環境和服務,以及 ComfyUI 工作流程 具有驚豔的視覺效果。 RunComfy還提供 AI Models, 幫助藝術家利用最新的AI工具創作出令人驚艷的藝術作品。