SAM 3 no ComfyUI Workflow | AI de Segmentação de Imagens de Precisão

ComfyUI SAM 3 Workflow

SAM 3 in ComfyUI Workflow | Precision Image Segmentation AI

Want to run this workflow?

Fully operational workflows
No missing nodes or models
No manual setups required
Features stunning visuals

ComfyUI SAM 3 Examples

SAM 3 Workflow de Segmentação de Imagens e Vídeos para ComfyUI#

Este workflow traz o SAM 3 para o ComfyUI para detecção e segmentação rápida e precisa de objetos tanto em imagens quanto em vídeos. É projetado para artistas e usuários técnicos que precisam de máscaras confiáveis para VFX, rotoscopia, composição e edição assistida por AI. Com prompts de texto, seleção por caixas e propagação quadro a quadro, o SAM 3 entrega máscaras consistentes que se mantêm em cenas complexas.

O gráfico inclui dois pipelines de imagem e um pipeline de vídeo. Você pode segmentar descrevendo o alvo com texto, desenhando caixas ao redor dele ou iniciando no primeiro quadro de vídeo e deixando o SAM 3 propagar máscaras por todo o clipe. O workflow pré-visualiza os resultados inline e salva sobreposições de visualização e saídas somente de máscara.

Modelos chave no workflow Comfyui SAM 3#

SAM 3. O modelo de segmentação de próxima geração que alimenta o mascaramento de imagens e vídeos neste gráfico. É fornecido via a integração ComfyUI em PozzettiAndrea/ComfyUI-SAM3 e fornece máscaras robustas e propostas de região em conteúdos diversos.

Como usar o workflow Comfyui SAM 3#

À primeira vista, o workflow tem três vias: Imagem com prompt de texto semântico, Imagem com prompt de caixa, e Vídeo com inicialização mais propagação. Todas as vias usam os mesmos pesos SAM 3 e convergem em pré-visualizações e salvamentos.

Imagem#

O grupo de Imagem carrega uma foto com LoadImage (#4) e os pesos SAM 3 com LoadSAM3Model (#1). A partir daí, a imagem flui para dois ramos alternativos de segmentação SAM 3 para que você possa escolher a maneira mais rápida de obter uma máscara limpa. Cada ramo retorna uma sobreposição de visualização para QC rápido e uma máscara binária para trabalho posterior. Use a via de imagem quando precisar de uma única máscara SAM 3 de alta qualidade rapidamente.

Solução de Imagem Um: Segmentação Semântica#

Este caminho segmenta com pistas de linguagem. DeepTranslatorTextNode (#16) permite que você digite uma descrição em linguagem natural em seu idioma preferido, que é então roteada para SAM3Segmentation (#82). O SAM 3 interpreta o texto e retorna uma máscara além de uma sobreposição colorida que você pode salvar via SaveImage (#23) e inspecionar com MaskPreview (#15). Use substantivos curtos e concretos para melhores resultados, e refine sendo mais específico se vários objetos coincidirem.

Solução de Imagem Três: Caixas#

Este caminho segmenta com caixas de região de interesse. Use SAM3BBoxCollector (#84) para desenhar uma ou mais caixas ao redor do que você deseja, então execute SAM3Segmentation (#81) para calcular a máscara guiada por essas caixas. Você pode adicionar caixas de exclusão para suprimir distrações próximas e obter uma máscara SAM 3 mais ajustada. Os resultados são pré-visualizados com PreviewImage (#65) e MaskPreview (#66) e podem ser exportados para trabalho de composição.

Vídeo#

O grupo de Vídeo carrega seu clipe com VHS_LoadVideo (#75) da Video Helper Suite e inicializa o modelo com SAM3VideoModelLoader (#69). Use SAM3VideoSegmentation (#78) para definir a seleção inicial no primeiro quadro, opcionalmente auxiliado por pontos via SAM3PointCollector (#79) ou caixas, se necessário. Em seguida, SAM3Propagate (#77) impulsiona o SAM 3 para frente e para trás no clipe para manter máscaras consistentes mesmo com movimento e oclusão. SAM3VideoOutput (#76) fornece tanto uma visualização de sobreposição quanto máscaras por quadro, que são transformadas em MP4s com CreateVideo (#70, #74) e salvas via SaveVideo (#71, #72). Use esta via quando precisar de máscaras SAM 3 limpas e temporalmente estáveis para edição ou composição.

Nós chave no workflow Comfyui SAM 3#

LoadSAM3Model (#1) Carrega os pesos SAM 3 para tarefas de imagem. Se você trocar os pesos, mantenha suas vias de imagem consistentes para que as pré-visualizações e salvamentos reflitam o mesmo backbone SAM 3.

SAM3Segmentation (#82) Segmentação de imagem orientada por texto. Forneça um prompt de texto claro descrevendo a classe alvo. Se múltiplos objetos forem detectados, torne a descrição mais específica ou execute múltiplas passagens para coletar máscaras SAM 3 separadas.

SAM3Segmentation (#81) Segmentação de imagem orientada por caixas. Desenhe uma ou mais caixas apertadas ao redor do objeto. Use caixas adicionais para excluir regiões adjacentes se a máscara vazar, então execute novamente para refinar a saída SAM 3.

SAM3VideoModelLoader (#69) Inicializa o modelo de vídeo SAM 3 para a via do clipe. Mantenha isso consistente com sua escolha de modelo de imagem se planejar combinar aparências entre stills e filmagens.

SAM3VideoSegmentation (#78) Define a seleção inicial no primeiro quadro usando texto, pontos ou caixas. Comece com a pista mais simples que isola claramente o sujeito. Se a máscara do primeiro quadro for perfeita, a propagação será mais fácil e rápida no restante do vídeo.

SAM3Propagate (#77) Propaga a máscara inicial através da sequência. Ajuste seu comportamento quando sujeitos se movem rapidamente, mudam de escala ou ocorrem parcialmente. Se aparecer desvio após uma mudança de cena ou corte, re-inicialize perto do corte e propague novamente para manter os resultados SAM 3 estáveis.

SAM3VideoOutput (#76) Empacota as máscaras SAM 3 propagadas e uma sobreposição de visualização. Use o MP4 de sobreposição para revisar a qualidade quadro a quadro, e use o MP4 somente de máscara para ingestão direta em composição ou editorial.

SAM3BBoxCollector (#84) Ferramenta de caixa interativa para seleção de imagem. Desenhe caixas positivas apertadas e caixas negativas opcionais para guiar o SAM 3 em direção a limites precisos, então pré-visualize e itere.

SAM3PointCollector (#79) Ferramenta de ponto interativa para inicialização de vídeo. Adicione alguns cliques positivos e negativos bem colocados no primeiro quadro para direcionar o SAM 3 quando texto ou caixas sozinhos forem ambíguos.

VHS_LoadVideo (#75) Ingestão de vídeo da Video Helper Suite Kosinkadink/ComfyUI-VideoHelperSuite. Use para carregar seu clipe, inspecionar quadros e entregar imagens aos nós de vídeo SAM 3 para inicialização e propagação.

Extras opcionais#

Combine texto e caixas em imagens difíceis. Use uma descrição de texto SAM 3 específica e depois adicione caixas para suprimir a desordem próxima.
Para múltiplos objetos, execute passagens separadas e salve cada máscara SAM 3, depois sobreponha-as em seu compositor.
Em vídeos com cortes difíceis, re-inicialize logo após o corte antes de executar a propagação SAM 3 novamente para máscaras consistentes.
Salve tanto o vídeo de sobreposição quanto o somente de máscara. O de sobreposição é ideal para QC, enquanto o arquivo somente de máscara entra diretamente em pipelines de rotoscopia ou keying.

Agradecimentos#

Este workflow implementa e se baseia nos seguintes trabalhos e recursos. Agradecemos a PozzettiAndrea por ComfyUI-SAM3 por suas contribuições e manutenção. Para detalhes autoritativos, por favor, consulte a documentação original e os repositórios linkados abaixo.

Recursos#

PozzettiAndrea/ComfyUI-SAM3
- GitHub: ComfyUI-SAM3

Nota: O uso dos modelos, conjuntos de dados e código referenciados está sujeito às respectivas licenças e termos fornecidos por seus autores e mantenedores.

Want More ComfyUI Workflows?

Segment Anything V2 (SAM2) | Segmentação de Vídeo

Segmentação de objetos em vídeos com precisão incomparável.

AnimateDiff + AutoMask + ControlNet | Efeitos Visuais (VFX)

Aprimore os VFX com AnimateDiff, AutoMask e ControlNet para resultados precisos e controlados.

ComfyUI Grounding | Fluxo de Trabalho de Rastreamento de Objetos

Rastreie qualquer assunto com precisão de pixel para resultados VFX impressionantes.

MV-Adapter | Gerador Multi-visão de Alta Resolução

Gere visões de 360 graus de qualquer coisa a partir de uma única imagem ou descrição.

AnimateDiff + ControlNet + AutoMask | Estilo de Quadrinhos

Reestilize vídeos sem esforço, convertendo personagens realistas em anime enquanto mantém os planos de fundo originais intactos.

Flux Kontext Pulid | Geração de Personagem Consistente

Crie personagens consistentes usando FLUX Kontext com uma única imagem de referência facial.

Cosmos-Predict2 | Text2Image & Video2World

Rápido e real! NVIDIA Cosmos com física verdadeira.

Wan 2.2 Geração de Imagens | Pacote de Fluxo de Trabalho 2-em-1

MoE Mix + Somente-Baixo com aumento de resolução. Escolha um.

Suporte

Recursos

Legal

RunComfy

RunComfy é a principal ComfyUI plataforma, oferecendo ComfyUI online ambiente e serviços, juntamente com fluxos de trabalho do ComfyUI apresentando visuais impressionantes. RunComfy também oferece AI Models, permitindo que artistas utilizem as mais recentes ferramentas de AI para criar arte incrível.

SAM 3 | Ferramenta Avançada de Segmentação de Objetos