SAM 3 in ComfyUI Workflow | Präzise Bildsegmentierung KI

ComfyUI SAM 3 Arbeitsablauf

SAM 3 in ComfyUI Workflow | Precision Image Segmentation AI

Möchtest du diesen Workflow ausführen?

Voll funktionsfähige Workflows
Keine fehlenden Nodes oder Modelle
Keine manuelle Einrichtung erforderlich
Beeindruckende Visualisierungen

ComfyUI SAM 3 Beispiele

SAM 3 Bild- und Video-Segmentierungs-Workflow für ComfyUI#

Dieser Workflow bringt SAM 3 zu ComfyUI für schnelle, präzise Objekterkennung und -segmentierung sowohl auf Bildern als auch auf Videos. Er ist für Künstler und technische Benutzer konzipiert, die zuverlässige Masken für VFX, Rotoskopie, Komposition und KI-unterstützte Bearbeitung benötigen. Mit Text-Prompts, Boxenauswahl und Frame-zu-Frame-Propagation liefert SAM 3 konsistente Masken, die auch in komplexen Szenen bestehen.

Der Graph umfasst zwei Bildpipelines und eine Videopipeline. Sie können das Ziel durch Textbeschreibung segmentieren, indem Sie Boxen darum zeichnen oder indem Sie auf dem ersten Videoframe initialisieren und SAM 3 die Masken durch den gesamten Clip propagieren lassen. Der Workflow zeigt die Ergebnisse inline an und speichert Visualisierungsüberlagerungen und Masken-Only-Ausgaben.

Wichtige Modelle im ComfyUI SAM 3 Workflow#

SAM 3. Das Next-Generation-Segmentierungsmodell, das sowohl die Bild- als auch die Videomaskierung in diesem Graphen antreibt. Es wird über die ComfyUI-Integration in PozzettiAndrea/ComfyUI-SAM3 bereitgestellt und bietet robuste Masken und Regionsvorschläge für diverse Inhalte.

So verwenden Sie den ComfyUI SAM 3 Workflow#

Auf einen Blick hat der Workflow drei Bahnen: Bild mit semantischem Text-Prompting, Bild mit Box-Prompting und Video mit Initialisierung plus Propagation. Alle Bahnen verwenden die gleichen SAM 3 Gewichte und konvergieren auf Vorschauen und Speichern.

Bild#

Die Bildgruppe lädt ein Bild mit LoadImage (#4) und die SAM 3 Gewichte mit LoadSAM3Model (#1). Von dort aus fließt das Bild in zwei alternative SAM 3 Segmentierungszweige, sodass Sie den schnellsten Weg wählen können, um eine saubere Maske zu erhalten. Jeder Zweig gibt eine Visualisierungsüberlagerung für schnelles QC und eine Binärmaske für nachgelagerte Arbeiten zurück. Verwenden Sie die Bildbahn, wenn Sie schnell eine einzelne hochwertige SAM 3 Maske benötigen.

Bildlösung Eins: Semantische Segmentierung#

Dieser Pfad segmentiert mit Sprachhinweisen. DeepTranslatorTextNode (#16) ermöglicht es Ihnen, eine natürliche Sprachbeschreibung in Ihrer bevorzugten Sprache einzugeben, die dann in SAM3Segmentation (#82) geleitet wird. SAM 3 interpretiert den Text und gibt eine Maske plus eine kolorierte Überlagerung zurück, die Sie über SaveImage (#23) speichern und mit MaskPreview (#15) inspizieren können. Verwenden Sie kurze, konkrete Substantive für beste Ergebnisse und verfeinern Sie, indem Sie spezifischer werden, wenn mehrere Objekte übereinstimmen.

Bildlösung Drei: Boxen#

Dieser Pfad segmentiert mit Interessensbereichsboxen. Verwenden Sie SAM3BBoxCollector (#84), um eine oder mehrere Boxen um das gewünschte Objekt zu zeichnen, und führen Sie dann SAM3Segmentation (#81) aus, um die Maske anhand dieser Boxen zu berechnen. Sie können Ausschlussboxen hinzufügen, um nahe Ablenkungen zu unterdrücken und eine engere SAM 3 Maske zu erhalten. Ergebnisse werden mit PreviewImage (#65) und MaskPreview (#66) angezeigt und können für Kompositionsarbeiten exportiert werden.

Video#

Die Videogruppe lädt Ihren Clip mit VHS_LoadVideo (#75) aus der Video Helper Suite und initialisiert das Modell mit SAM3VideoModelLoader (#69). Verwenden Sie SAM3VideoSegmentation (#78), um die anfängliche Auswahl auf dem ersten Frame festzulegen, optional unterstützt durch Punkte über SAM3PointCollector (#79) oder Boxen, falls erforderlich. Dann treibt SAM3Propagate (#77) SAM 3 vorwärts und rückwärts durch den Clip, um konsistente Masken selbst bei Bewegung und Verdeckung aufrechtzuerhalten. SAM3VideoOutput (#76) liefert sowohl eine Überlagerungsvisualisierung als auch pro-Frame-Masken, die mit CreateVideo (#70, #74) in MP4s umgewandelt und über SaveVideo (#71, #72) gespeichert werden. Verwenden Sie diese Bahn, wenn Sie saubere, zeitlich stabile SAM 3 Masken für die Bearbeitung oder Komposition benötigen.

Wichtige Knoten im ComfyUI SAM 3 Workflow#

LoadSAM3Model (#1) Lädt die SAM 3 Gewichte für Bildaufgaben. Wenn Sie Gewichte austauschen, halten Sie Ihre Bildbahnen konsistent, damit Vorschauen und Speichern denselben SAM 3 Backbone widerspiegeln.

SAM3Segmentation (#82) Textgesteuerte Bildsegmentierung. Geben Sie eine klare Textanweisung zur Beschreibung der Zielklasse an. Wenn mehrere Objekte erkannt werden, machen Sie die Beschreibung spezifischer oder führen Sie mehrere Durchläufe durch, um separate SAM 3 Masken zu sammeln.

SAM3Segmentation (#81) Boxgesteuerte Bildsegmentierung. Zeichnen Sie eine oder mehrere enge Boxen um das Objekt. Verwenden Sie zusätzliche Boxen, um angrenzende Regionen auszuschließen, wenn die Maske ausläuft, und führen Sie sie dann erneut aus, um die SAM 3 Ausgabe zu verfeinern.

SAM3VideoModelLoader (#69) Initialisiert das SAM 3 Videomodell für die Clipbahn. Halten Sie dies konsistent mit Ihrer Bildmodellauswahl, wenn Sie Looks über Standbilder und Filmmaterial hinweg abgleichen möchten.

SAM3VideoSegmentation (#78) Legt die anfängliche Auswahl auf dem ersten Frame mit Text, Punkten oder Boxen fest. Beginnen Sie mit dem einfachsten Hinweis, der das Thema klar isoliert. Wenn die Maske des ersten Frames perfekt ist, wird die Propagation über den Rest des Videos einfacher und schneller.

SAM3Propagate (#77) Propagiert die anfängliche Maske durch die Sequenz. Passen Sie ihr Verhalten an, wenn sich Subjekte schnell bewegen, den Maßstab ändern oder teilweise verdecken. Wenn nach einem Szenenwechsel oder Schnitt Drift auftritt, initialisieren Sie in der Nähe des Schnitts neu und propagieren Sie erneut, um SAM 3 Ergebnisse stabil zu halten.

SAM3VideoOutput (#76) Verpackt die propagierten SAM 3 Masken und eine Visualisierungsüberlagerung. Verwenden Sie das Overlay-MP4, um die Qualität Frame für Frame zu überprüfen, und verwenden Sie das Masken-Only-MP4 für den direkten Import in Komposition oder Redaktion.

SAM3BBoxCollector (#84) Interaktives Box-Werkzeug zur Bildauswahl. Zeichnen Sie enge positive Boxen und optionale negative Boxen, um SAM 3 zu präzisen Grenzen zu führen, dann Vorschau und Iteration.

SAM3PointCollector (#79) Interaktives Punkt-Werkzeug zur Videoinitialisierung. Fügen Sie einige gut platzierte positive und negative Klicks auf dem ersten Frame hinzu, um SAM 3 zu steuern, wenn Text oder Boxen allein mehrdeutig sind.

VHS_LoadVideo (#75) Videoaufnahme aus der Video Helper Suite Kosinkadink/ComfyUI-VideoHelperSuite. Verwenden Sie es, um Ihren Clip zu laden, Frames zu inspizieren und Bilder an die SAM 3 Videoknoten zur Initialisierung und Propagation zu übergeben.

Optionale Extras#

Kombinieren Sie Text und Boxen bei schwierigen Bildern. Verwenden Sie eine spezifische SAM 3 Textbeschreibung und fügen Sie dann Boxen hinzu, um nahe Unordnung zu unterdrücken.
Bei mehreren Objekten führen Sie separate Durchläufe durch und speichern Sie jede SAM 3 Maske, dann schichten Sie sie in Ihrem Kompositionsprogramm.
Bei Videos mit harten Schnitten initialisieren Sie direkt nach dem Schnitt neu, bevor Sie die SAM 3 Propagation erneut ausführen, um konsistente Masken zu erhalten.
Speichern Sie sowohl das Overlay- als auch das Masken-Only-Video. Das Overlay ist ideal für QC, während die Masken-Only-Datei direkt in Rotoskopie- oder Keying-Pipelines eingefügt wird.

Danksagungen#

Dieser Workflow implementiert und baut auf den folgenden Arbeiten und Ressourcen auf. Wir danken PozzettiAndrea für ComfyUI-SAM3 für ihre Beiträge und Wartung. Für autoritative Details verweisen wir auf die Originaldokumentation und Repositories, die unten verlinkt sind.

Ressourcen#

PozzettiAndrea/ComfyUI-SAM3
- GitHub: ComfyUI-SAM3

Hinweis: Die Nutzung der referenzierten Modelle, Datensätze und Codes unterliegt den jeweiligen Lizenzen und Bedingungen, die von ihren Autoren und Betreuern bereitgestellt werden.

Want More ComfyUI Workflows?

Segment Anything V2 (SAM2) | Video-Segmentierung

Objekterkennung in Videos mit unübertroffener Genauigkeit.

AnimateDiff + AutoMask + ControlNet | Visual Effects (VFX)

Verbessern Sie VFX mit AnimateDiff, AutoMask und ControlNet für präzise, kontrollierte Ergebnisse.

ComfyUI Grounding | Objektverfolgungs-Workflow

Verfolgen Sie jedes Objekt mit pixelgenauer Genauigkeit für beeindruckende VFX-Ergebnisse.

MV-Adapter | Hochauflösender Mehransichtsgenerator

Erzeugen Sie 360-Grad-Ansichten von allem aus einem einzelnen Bild oder einer Beschreibung.

AnimateDiff + ControlNet + AutoMask | Comic-Stil

Müheloses Umstyling von Videos, bei dem realistische Charaktere in Anime umgewandelt werden, während die ursprünglichen Hintergründe erhalten bleiben.

ReActor | Schneller Gesichtstausch

Professionelles Gesichtstausch-Toolkit für ComfyUI, das einen natürlichen Gesichtsersatz und Verbesserungen ermöglicht.

Kohärente Szenen erstellen | Konsistenter Story-Art-Generator

Nahtlose Erzählungsszenen mit reicher visueller Konsistenz aufbauen.

Hallo2 | Lip-Sync-Porträtanimation

Audiogesteuerte Lip-Synchronisation für Porträtanimationen in 4K.

Support

Ressourcen

Rechtliches

RunComfy

RunComfy ist die führende ComfyUI Plattform, die ComfyUI online Umgebung und Services bietet, zusammen mit ComfyUI Workflows mit atemberaubenden Visualisierungen. RunComfy bietet auch AI Models, Künstlern ermöglichen, die neuesten AI-Tools zu nutzen, um unglaubliche Kunst zu schaffen.

SAM 3 | Fortgeschrittenes Objektsegmentierungstool