SAM 3 in ComfyUI Workflow | Segmentazione Immagini AI di Precisione

ComfyUI SAM 3 Workflow

SAM 3 in ComfyUI Workflow | Precision Image Segmentation AI

Want to run this workflow?

Fully operational workflows
No missing nodes or models
No manual setups required
Features stunning visuals

ComfyUI SAM 3 Examples

SAM 3 Immagine e Workflow di Segmentazione Video per ComfyUI#

Questo workflow porta SAM 3 a ComfyUI per un rilevamento e segmentazione degli oggetti rapidi e accurati su immagini e video. È progettato per artisti e utenti tecnici che necessitano di maschere affidabili per VFX, rotoscoping, compositing e editing assistito dall'AI. Con prompt testuali, selezione di box e propagazione da fotogramma a fotogramma, SAM 3 fornisce maschere coerenti che si mantengono in scene complesse.

Il grafico include due pipeline di immagini e una pipeline video. Puoi segmentare descrivendo il target con testo, disegnando box intorno ad esso, o inizializzando sul primo fotogramma video e lasciando che SAM 3 propaghi le maschere attraverso l'intero clip. Il workflow visualizza i risultati in linea e salva sovrapposizioni di visualizzazione e output solo maschera.

Modelli chiave nel workflow SAM 3 Comfyui#

SAM 3. Il modello di segmentazione di nuova generazione che alimenta sia la mascheratura delle immagini che dei video in questo grafico. È fornito tramite l'integrazione ComfyUI in PozzettiAndrea/ComfyUI-SAM3 e fornisce maschere robuste e proposte di regioni su contenuti diversi.

Come usare il workflow SAM 3 Comfyui#

A colpo d'occhio, il workflow ha tre corsie: Immagine con prompt testuale semantico, Immagine con prompt di box e Video con inizializzazione più propagazione. Tutte le corsie utilizzano gli stessi pesi SAM 3 e convergono su anteprime e salvataggi.

Immagine#

Il gruppo Immagine carica un'immagine con LoadImage (#4) e i pesi SAM 3 con LoadSAM3Model (#1). Da lì, l'immagine fluisce in due rami di segmentazione SAM 3 alternativi, così puoi scegliere il modo più veloce per ottenere una maschera pulita. Ogni ramo restituisce una sovrapposizione di visualizzazione per un QC rapido e una maschera binaria per il lavoro a valle. Usa la corsia immagine quando hai bisogno rapidamente di una singola maschera SAM 3 di alta qualità.

Soluzione Immagine Uno: Segmentazione Semantica#

Questo percorso segmenta con suggerimenti linguistici. DeepTranslatorTextNode (#16) ti permette di digitare una descrizione in linguaggio naturale nella tua lingua preferita, che viene poi instradata in SAM3Segmentation (#82). SAM 3 interpreta il testo e restituisce una maschera più una sovrapposizione colorata che puoi salvare tramite SaveImage (#23) e ispezionare con MaskPreview (#15). Usa nomi concreti e brevi per ottenere i migliori risultati e affina essendo più specifico se più oggetti corrispondono.

Soluzione Immagine Tre: Box#

Questo percorso segmenta con box di regione d'interesse. Usa SAM3BBoxCollector (#84) per disegnare uno o più box intorno a ciò che desideri, poi esegui SAM3Segmentation (#81) per calcolare la maschera guidata da quei box. Puoi aggiungere box di esclusione per sopprimere distrattori vicini e ottenere una maschera SAM 3 più stretta. I risultati vengono visualizzati con PreviewImage (#65) e MaskPreview (#66) e possono essere esportati per il lavoro di composizione.

Video#

Il gruppo Video carica il tuo clip con VHS_LoadVideo (#75) dalla Video Helper Suite e inizializza il modello con SAM3VideoModelLoader (#69). Usa SAM3VideoSegmentation (#78) per impostare la selezione iniziale sul primo fotogramma, opzionalmente aiutato da punti tramite SAM3PointCollector (#79) o box se necessario. Poi SAM3Propagate (#77) guida SAM 3 avanti e indietro nel clip per mantenere maschere coerenti anche con movimento e occlusione. SAM3VideoOutput (#76) fornisce sia una visualizzazione di sovrapposizione che maschere per fotogramma, che vengono trasformate in MP4 con CreateVideo (#70, #74) e salvate tramite SaveVideo (#71, #72). Usa questa corsia quando hai bisogno di maschere SAM 3 pulite e temporalmente stabili per editing o compositing.

Nodi chiave nel workflow SAM 3 Comfyui#

LoadSAM3Model (#1) Carica i pesi SAM 3 per le attività di immagine. Se cambi i pesi, mantieni le tue corsie immagine coerenti in modo che le anteprime e i salvataggi riflettano lo stesso backbone SAM 3.

SAM3Segmentation (#82) Segmentazione delle immagini guidata dal testo. Fornisci un prompt testuale chiaro che descriva la classe target. Se vengono rilevati più oggetti, rendi la descrizione più specifica o esegui più passaggi per raccogliere maschere SAM 3 separate.

SAM3Segmentation (#81) Segmentazione delle immagini guidata da box. Disegna uno o più box stretti intorno all'oggetto. Usa box aggiuntivi per escludere regioni adiacenti se la maschera si espande, poi esegui nuovamente per affinare l'output SAM 3.

SAM3VideoModelLoader (#69) Inizializza il modello video SAM 3 per la corsia del clip. Mantieni questo coerente con la tua scelta di modello di immagine se intendi abbinare gli aspetti tra immagini fisse e filmati.

SAM3VideoSegmentation (#78) Imposta la selezione iniziale sul primo fotogramma utilizzando testo, punti o box. Inizia con l'indicazione più semplice che isola chiaramente il soggetto. Se la maschera del primo fotogramma è perfetta, la propagazione sarà più facile e veloce nel resto del video.

SAM3Propagate (#77) Propaga la maschera iniziale attraverso la sequenza. Regola il suo comportamento quando i soggetti si muovono rapidamente, cambiano scala o si occludono parzialmente. Se appare un drift dopo un cambio di scena o un taglio, re-inizializza vicino al taglio e propaga di nuovo per mantenere stabili i risultati SAM 3.

SAM3VideoOutput (#76) Confeziona le maschere SAM 3 propagate e una visualizzazione di sovrapposizione. Usa l'MP4 di sovrapposizione per esaminare la qualità fotogramma per fotogramma, e usa l'MP4 solo maschera per l'ingestione diretta in composizione o editoriale.

SAM3BBoxCollector (#84) Strumento box interattivo per la selezione delle immagini. Disegna box positivi stretti e box negativi opzionali per guidare SAM 3 verso bordi precisi, poi visualizza e itera.

SAM3PointCollector (#79) Strumento punto interattivo per l'inizializzazione video. Aggiungi alcuni clic positivi e negativi ben posizionati sul primo fotogramma per indirizzare SAM 3 quando testo o box da soli sono ambigui.

VHS_LoadVideo (#75) Ingestione video dalla Video Helper Suite Kosinkadink/ComfyUI-VideoHelperSuite. Usalo per caricare il tuo clip, ispezionare i fotogrammi e trasferire le immagini ai nodi video SAM 3 per l'inizializzazione e la propagazione.

Extra opzionali#

Combina testo e box su immagini difficili. Usa una descrizione testuale SAM 3 specifica, poi aggiungi box per sopprimere il disordine vicino.
Per oggetti multipli, esegui passaggi separati e salva ciascuna maschera SAM 3, poi sovrapponile nel tuo compositore.
Su video con tagli difficili, re-inizializza subito dopo il taglio prima di eseguire nuovamente la propagazione SAM 3 per maschere coerenti.
Salva sia il video di sovrapposizione che quello solo maschera. La sovrapposizione è ideale per QC, mentre il file solo maschera entra direttamente nelle pipeline di rotoscoping o keying.

Ringraziamenti#

Questo workflow implementa e si basa sui seguenti lavori e risorse. Ringraziamo calorosamente PozzettiAndrea per ComfyUI-SAM3 per i loro contributi e la manutenzione. Per dettagli autorevoli, si prega di fare riferimento alla documentazione originale e ai repository collegati sotto.

Risorse#

PozzettiAndrea/ComfyUI-SAM3
- GitHub: ComfyUI-SAM3

Nota: L'uso dei modelli, dataset e codici di riferimento è soggetto alle rispettive licenze e termini forniti dai loro autori e manutentori.

Want More ComfyUI Workflows?

Segment Anything V2 (SAM2) | Segmentazione Video

Segmentazione degli oggetti nei video con un'accuratezza senza pari.

AnimateDiff + AutoMask + ControlNet | Effetti Visivi (VFX)

Migliora gli effetti visivi con AnimateDiff, AutoMask e ControlNet per risultati precisi e controllati.

ComfyUI Grounding | Workflow di Tracciamento Oggetti

Traccia qualsiasi soggetto con precisione pixel-perfetta per risultati VFX straordinari.

MV-Adapter | Generatore Multi-vista ad Alta Risoluzione

Genera viste a 360 gradi di qualsiasi cosa da un'unica immagine o descrizione.

AnimateDiff + ControlNet + AutoMask | Stile fumetto

Rielabora facilmente i video, convertendo i personaggi realistici in anime mantenendo intatti gli sfondi originali.

InfiniteTalk | Generatore di Avatar Sincronizzato sulle Labbra

Foto + Voce = Avatar Parlante Perfettamente Sincronizzato in Minuti

LongCat Video Avatar 1.5 ComfyUI | Generatore Sincronizzato con le Labbra

Trasforma l'immagine del personaggio e l'audio in un video avatar perfettamente sincronizzato con le labbra.

Sostituzione del Personaggio Video (MoCha) | Strumento di Sostituzione Realistico

Sostituisci rapidamente i personaggi video con controllo realistico del movimento e dell'illuminazione.

Supporto

Risorse

Legale

RunComfy

RunComfy è la piattaforma principale ComfyUI che offre ComfyUI online ambiente e servizi, insieme a workflow di ComfyUI con visuali mozzafiato. RunComfy offre anche AI Models, consentire agli artisti di sfruttare gli ultimi strumenti di AI per creare arte incredibile.

SAM 3 | Strumento Avanzato di Segmentazione degli Oggetti