ComfyUI Segment Anything V2 (SAM2): 画像と動画のセグメンテーション

ComfyUI-LivePortraitKJノードとその関連するワークフローは完全にKijaiによって開発されています。この革新的な作品に対して、Kijaiにすべての功績を捧げます。RunComfyプラットフォームでは、単にKijaiの貢献をコミュニティに紹介しています。現在、RunComfyとKijaiの間に正式な関係やパートナーシップはありません。Kijaiの作品に深く感謝しています！

ComfyUI Segment Anything V2 (SAM2) ワークフロー

このワークフローを実行しますか？

完全に動作するワークフロー
欠落したノードやモデルはありません
手動セットアップは不要
魅力的なビジュアルを特徴としています

ComfyUI Segment Anything V2 (SAM2) 例

Segment Anything V2、別名SAM2は、Meta AIによって開発された画期的なAIモデルで、画像および動画のオブジェクトセグメンテーションを革命的に変えます。

Segment Anything V2 (SAM2)とは？#

Segment Anything V2は、画像および動画全体のオブジェクトをシームレスにセグメント化する最先端のAIモデルです。これは、画像と動画のセグメンテーションタスクの両方を優れた精度と効率で処理できる最初の統合モデルです。Segment Anything V2 (SAM2)は、その前身であるSegment Anything Model (SAM)の成功を基に、プロンプト可能な機能を動画領域に拡張しています。

Segment Anything V2 (SAM2)を使用すると、クリック、バウンディングボックス、またはマスクなどのさまざまな入力方法を使用して画像または動画フレーム内のオブジェクトを選択できます。その後、モデルは選択されたオブジェクトをインテリジェントにセグメント化し、視覚コンテンツ内の特定の要素を正確に抽出および操作できるようにします。

Segment Anything V2 (SAM2)のハイライト#

最先端のパフォーマンス：SAM2は、画像および動画のオブジェクトセグメンテーション分野で既存のモデルを上回ります。画像セグメンテーションタスクでその前身であるSAMの性能を超える精度と精密度の新しい基準を設定します。
画像と動画のための統合モデル：SAM2は、画像および動画全体のオブジェクトをセグメント化するための統合ソリューションを提供する最初のモデルです。この統合により、AIアーティストはさまざまなセグメンテーションタスクに単一のモデルを使用できるため、ワークフローが簡素化されます。
強化された動画セグメンテーション機能：SAM2は、特にオブジェクトの部分を追跡する動画オブジェクトセグメンテーションで優れた性能を発揮します。既存の動画セグメンテーションモデルを上回り、フレーム全体でオブジェクトをセグメント化する精度と一貫性を向上させます。
Segment Aのハイライト。インタラクション時間の短縮：既存のインタラクティブな動画セグメンテーション方法と比較して、SAM2はユーザーからのインタラクション時間を短縮します。この効率性により、AIアーティストは創造的なビジョンに集中し、手動のセグメンテーションタスクに費やす時間を減らすことができます。
シンプルなデザインと高速な推論：高度な機能を持ちながら、SAM2はシンプルなアーキテクチャデザインを維持し、高速な推論速度を提供します。これにより、AIアーティストはパフォーマンスや効率を損なうことなく、SAM2をワークフローにシームレスに統合できます。

Segment Anything V2 (SAM2)の動作方法#

SAM2は、ターゲットオブジェクト情報をキャプチャするセッションごとのメモリモジュールを導入することにより、SAMのプロンプト可能な機能を動画に拡張します。これにより、一時的な消失があってもフレーム全体でオブジェクトを追跡できます。ストリーミングアーキテクチャは、動画フレームを1つずつ処理し、メモリモジュールが空のときにSAMのように動作します。これにより、リアルタイムの動画処理とSAMの機能の自然な一般化が可能になります。SAM2はまた、ユーザープロンプトに基づいたインタラクティブなマスク予測修正をサポートします。モデルは、ストリーミングメモリを備えたトランスフォーマーアーキテクチャを使用し、ユーザーインタラクションによってモデルとデータの両方を改善するモデルインザループデータエンジンを使用して収集された最大の動画セグメンテーションデータセットであるSA-Vデータセットでトレーニングされています。

ComfyUIでSegment Anything V2 (SAM2)を使用する方法#

このComfyUIワークフローは、クリック/ポイントを使用して動画フレーム内のオブジェクトを選択することをサポートします。

1. 動画の読み込み(アップロード)#

動画の読み込み: 処理したい動画を選択してアップロードします。

2. ポイントエディタ#

キーポイント: キャンバスに3つのキーポイント—positive0、positive1、およびnegative0を配置します：

positive0とpositive1は、セグメント化したい領域またはオブジェクトをマークします。

negative0は不要な領域や気を散らすものを除外するのに役立ちます。

ポイントストア: セグメンテーションプロセスを洗練するために、必要に応じてポイントを追加または削除できます。

3. SAM2のモデル選択#

モデルオプション: 利用可能なSAM2モデルから選択します：tiny、small、large、またはbase_plus。大きなモデルはより良い結果を提供しますが、ロード時間が長くなります。

詳細については、Kijai ComfyUI-segment-anything-2をご覧ください。

Want More ComfyUI Workflows?

Outpainting | 画像の拡張

Outpainting nodeとControlNet inpainting modelを使用して、画像を簡単に拡張できます。

SUPIR | 写真のようにリアルな画像/ビデオアップスケーラー

SUPIRは写真のようにリアルな画像復元を可能にし、SDXLモデルと連携し、テキストプロンプトによる画質向上をサポートします。

Wan 2.2 イメージ生成 | 2-in-1 ワークフローパック

MoE Mix + Low-Onlyとアップスケール。どちらかを選んでください。

SeedVR2 V2.5 | AIビデオアップスケーリングワークフロー

ビデオを迅速にアップスケールし、シャープで滑らかで映画のような結果を得られます。

ACE++ キャラクターの一貫性

単一の写真からポーズ、角度、スタイルにわたって一貫性のあるキャラクター画像を生成します。

JoyAI Image Edit ComfyUI | スマートAI写真エディター

正確なプロンプト駆動のAI編集で画像を変換します。

Ace Step 1.5 | 商用グレードのAI音楽ジェネレーター

テキストをスマートな計画とディフュージョンの力で完全な曲に変えます。

LTX 2.3 Sulphur 2 テキストからビデオへのワークフロー | シネマティックジェネレーター

テキストをシネマティックなキャラクタービデオに高速で変換し、同期されたモーションを実現します。

フォローする

サポート

リソース

法的情報

RunComfy

RunComfyは最高の ComfyUI プラットフォームです。次のものを提供しています: ComfyUIオンライン環境とサービス、および ComfyUIワークフロー魅力的なビジュアルが特徴です。 RunComfyはまた提供します AI Models, アーティストが最新のAIツールを活用して素晴らしいアートを作成できるようにする。

Segment Anything V2 (SAM2) | 動画セグメンテーション