SAM 3 in ComfyUI Workflow | 精密な画像セグメンテーションAI

ComfyUI SAM 3 Workflow

SAM 3 in ComfyUI Workflow | Precision Image Segmentation AI

Want to run this workflow?

Fully operational workflows
No missing nodes or models
No manual setups required
Features stunning visuals

ComfyUI SAM 3 Examples

SAM 3 画像およびビデオセグメンテーションワークフロー for ComfyUI#

このワークフローは、SAM 3をComfyUIに導入し、画像とビデオの両方で高速かつ正確なオブジェクト検出とセグメンテーションを実現します。VFX、ロトスコーピング、合成、AI支援編集のために信頼できるマスクを必要とするアーティストや技術ユーザー向けに設計されています。テキストプロンプト、ボックス選択、フレーム間の伝播を使用して、SAM 3は複雑なシーンでも一貫したマスクを提供します。

グラフには2つの画像パイプラインと1つのビデオパイプラインが含まれています。ターゲットをテキストで説明するか、周囲にボックスを描くか、最初のビデオフレームで初期化し、SAM 3がクリップ全体を通じてマスクを伝播させるかでセグメント化できます。ワークフローは結果をインラインでプレビューし、ビジュアライゼーションオーバーレイとマスクのみの出力を保存します。

Comfyui SAM 3ワークフローの主要モデル#

SAM 3。このグラフで画像とビデオのマスキングを駆動する次世代セグメンテーションモデルです。PozzettiAndrea/ComfyUI-SAM3のComfyUI統合を通じて提供され、多様なコンテンツにわたる堅牢なマスクと領域提案を供給します。

Comfyui SAM 3ワークフローの使用方法#

一目でわかるように、ワークフローには3つのレーンがあります：セマンティックテキストプロンプトを使用した画像、ボックスプロンプトを使用した画像、初期化および伝播を伴うビデオ。すべてのレーンは同じSAM 3の重みを使用し、プレビューと保存で収束します。

画像#

画像グループはLoadImage (#4)で画像をロードし、LoadSAM3Model (#1)でSAM 3の重みをロードします。そこから、画像は2つの代替SAM 3セグメンテーションブランチに流れ、クリーンなマスクを得るための最速の方法を選択できます。各ブランチは迅速なQCのためのビジュアライゼーションオーバーレイと下流作業のためのバイナリマスクを返します。高品質なSAM 3マスクをすぐに必要とする場合は、画像レーンを使用してください。

画像ソリューション1: セマンティックセグメンテーション#

このパスは言語の手がかりでセグメント化します。DeepTranslatorTextNode (#16)を使用して、希望する言語で自然言語の説明を入力し、それがSAM3Segmentation (#82)にルーティングされます。SAM 3はテキストを解釈し、マスクとカラー化されたオーバーレイを返します。これをSaveImage (#23)を介して保存し、MaskPreview (#15)で確認できます。最良の結果を得るためには、短く具体的な名詞を使用し、複数のオブジェクトが一致する場合は、より具体的にすることで精度を高めます。

画像ソリューション3: ボックス#

このパスは関心領域ボックスでセグメント化します。SAM3BBoxCollector (#84)を使用して、望むものの周囲に1つ以上のボックスを描き、SAM3Segmentation (#81)を実行して、それらのボックスに基づいてマスクを計算します。近くの気を散らすものを抑制するために除外ボックスを追加し、よりタイトなSAM 3マスクを得ることができます。結果はPreviewImage (#65)とMaskPreview (#66)でプレビューされ、コンプ作業のためにエクスポートできます。

ビデオ#

ビデオグループはVHS_LoadVideo (#75)を使用してVideo Helper Suiteからクリップをロードし、SAM3VideoModelLoader (#69)でモデルを初期化します。SAM3VideoSegmentation (#78)を使用して、最初のフレームで初期選択を設定します。必要に応じてSAM3PointCollector (#79)やボックスを使用して支援します。その後、SAM3Propagate (#77)がクリップを通じて前後にSAM 3を駆動し、動きや遮蔽がある場合でも一貫したマスクを維持します。SAM3VideoOutput (#76)はオーバーレイビジュアライゼーションとフレームごとのマスクを生成し、CreateVideo (#70, #74)でMP4に変換し、SaveVideo (#71, #72)で保存します。編集や合成のためにクリーンで時間的に安定したSAM 3マスクが必要な場合は、このレーンを使用してください。

Comfyui SAM 3ワークフローの主要ノード#

LoadSAM3Model (#1) 画像タスクのためにSAM 3の重みをロードします。重みを交換する場合は、画像レーンを一貫させて、プレビューと保存が同じSAM 3バックボーンを反映するようにしてください。

SAM3Segmentation (#82) テキスト駆動の画像セグメンテーション。ターゲットクラスを説明する明確なテキストプロンプトを提供します。複数のオブジェクトが検出された場合は、説明をより具体的にするか、複数回実行して別々のSAM 3マスクを収集します。

SAM3Segmentation (#81) ボックス駆動の画像セグメンテーション。オブジェクトの周囲に1つ以上のタイトなボックスを描きます。マスクが流出する場合は、隣接する領域を除外するために追加のボックスを使用し、その後再実行してSAM 3の出力を精緻化します。

SAM3VideoModelLoader (#69) クリップレーンのためにSAM 3ビデオモデルを初期化します。静止画と映像の外観を一致させる場合は、画像モデルの選択と一貫させてください。

SAM3VideoSegmentation (#78) テキスト、ポイント、またはボックスを使用して最初のフレームで初期選択を設定します。最もシンプルな手がかりで、被写体をクリーンに分離することから始めます。最初のフレームのマスクが完璧であれば、残りのビデオ全体での伝播が簡単かつ迅速になります。

SAM3Propagate (#77) シーケンスを通じて初期マスクを伝播します。被写体が高速で動いたり、スケールが変わったり、一部が遮蔽されたりする場合に、その動作を調整します。シーンの変更やカット後にドリフトが発生した場合は、カット付近で再初期化し、再度伝播してSAM 3の結果を安定させます。

SAM3VideoOutput (#76) 伝播されたSAM 3マスクとビジュアライゼーションオーバーレイをパッケージ化します。オーバーレイMP4を使用して、各フレームの品質を確認し、マスクのみのMP4をコンプまたは編集に直接取り込むために使用します。

SAM3BBoxCollector (#84) 画像選択のためのインタラクティブボックストール。タイトなポジティブボックスとオプションのネガティブボックスを描いて、SAM 3を正確な境界に導き、プレビューして反復します。

SAM3PointCollector (#79) ビデオ初期化のためのインタラクティブポイントツール。最初のフレームで、テキストやボックスだけではあいまいな場合に、いくつかの適切に配置されたポジティブおよびネガティブクリックを追加します。

VHS_LoadVideo (#75) Video Helper Suite Kosinkadink/ComfyUI-VideoHelperSuiteからのビデオ取り込み。クリップをロードし、フレームを確認し、SAM 3ビデオノードに画像を手渡して初期化と伝播を行います。

オプションの追加機能#

難しい画像でテキストとボックスを組み合わせます。特定のSAM 3テキスト説明を使用し、次にボックスを追加して近くの乱雑さを抑制します。
複数のオブジェクトの場合は、別々にパスを実行し、各SAM 3マスクを保存し、それを合成ソフトでレイヤー化します。
ハードカットのあるビデオでは、カット直後に再初期化し、再度SAM 3伝播を実行して一貫したマスクを取得します。
オーバーレイとマスクのみのビデオの両方を保存します。オーバーレイはQCに最適で、マスクのみのファイルはロトスコーピングやキーイングパイプラインに直接投入されます。

謝辞#

このワークフローは、以下の作品やリソースを実装および構築しています。PozzettiAndreaのComfyUI-SAM3に対する貢献とメンテナンスに感謝します。権威ある詳細については、以下にリンクされた元のドキュメントおよびリポジトリを参照してください。

リソース#

PozzettiAndrea/ComfyUI-SAM3
- GitHub: ComfyUI-SAM3

注意: 参照されているモデル、データセット、およびコードの使用は、それぞれの著者および管理者によって提供されたライセンスおよび条件に従います。

Want More ComfyUI Workflows?

Segment Anything V2 (SAM2) | 動画セグメンテーション

比類のない精度での動画のオブジェクトセグメンテーション。

AnimateDiff + AutoMask + ControlNet | ビジュアルエフェクト（VFX）

AnimateDiff、AutoMask、ControlNetを使用してVFXを強化し、正確で制御された結果を得ましょう。

ComfyUI Grounding | オブジェクト追跡ワークフロー

ピクセル単位の精度であらゆる被写体を追跡し、驚異的なVFX結果を得ることができます。

MV-Adapter | 高解像度マルチビュージェネレーター

単一の画像や説明からあらゆるものの360度ビューを生成します。

AnimateDiff + ControlNet + オートマスク | コミックスタイル

リアルなキャラクターをアニメに変換し、元の背景をそのまま維持しながら、動画をスタイル変換します。

Z-Image De-Turbo LoRA 推論 | AI Toolkit ComfyUI

RCZimageDeturboカスタムノードを使用して、AI ToolkitでトレーニングされたZ-Image De-Turbo LoRAをComfyUIでトレーニング一致の動作で実行します。

AIビデオにおける制御可能なアニメーション | モーション制御ツール

ビデオを即座に正確にモーションルールに従わせましょう。

Portrait Master | テキストからポートレート

Portrait Masterを使用して、複雑なプロンプトに頼ることなく、ポートレート作成をより細かくコントロールできます。

フォローする

サポート

リソース

法的情報

RunComfy

RunComfyは最高の ComfyUI プラットフォームです。次のものを提供しています: ComfyUIオンライン環境とサービス、および ComfyUIワークフロー魅力的なビジュアルが特徴です。 RunComfyはまた提供します AI Models, アーティストが最新のAIツールを活用して素晴らしいアートを作成できるようにする。

SAM 3 | 高度なオブジェクトセグメンテーションツール