logo
RunComfy
ComfyUIPlaygroundPricing
discord logo
ComfyUI>ワークフロー>Segment Anything V2 (SAM2) | 動画セグメンテーション

Segment Anything V2 (SAM2) | 動画セグメンテーション

Workflow Name: RunComfy/Segment-Anything-V2
Workflow ID: 0000...1113
Meta AIによって開発されたSegment Anything V2 (SAM2)は、画像および動画のオブジェクトセグメンテーションを簡素化する画期的なAIモデルです。そのインテリジェントなセグメンテーション機能とさまざまな入力方法を組み合わせることで、AIアーティストのワークフローを簡素化します。SAM2の強化された動画セグメンテーション、短縮されたインタラクション時間、および高速な推論速度は、AI駆動のアートクリエーションの限界を押し広げる強力なツールです。ComfyUI-LivePortraitKJノードはKijaiによって作成され、このワークフローは完全に彼によって開発されました。

Segment Anything V2、別名SAM2は、Meta AIによって開発された画期的なAIモデルで、画像および動画のオブジェクトセグメンテーションを革命的に変えます。

Segment Anything V2 (SAM2)とは?

Segment Anything V2は、画像および動画全体のオブジェクトをシームレスにセグメント化する最先端のAIモデルです。これは、画像と動画のセグメンテーションタスクの両方を優れた精度と効率で処理できる最初の統合モデルです。Segment Anything V2 (SAM2)は、その前身であるSegment Anything Model (SAM)の成功を基に、プロンプト可能な機能を動画領域に拡張しています。

Segment Anything V2 (SAM2)を使用すると、クリック、バウンディングボックス、またはマスクなどのさまざまな入力方法を使用して画像または動画フレーム内のオブジェクトを選択できます。その後、モデルは選択されたオブジェクトをインテリジェントにセグメント化し、視覚コンテンツ内の特定の要素を正確に抽出および操作できるようにします。

Segment Anything V2 (SAM2)のハイライト

  1. 最先端のパフォーマンス:SAM2は、画像および動画のオブジェクトセグメンテーション分野で既存のモデルを上回ります。画像セグメンテーションタスクでその前身であるSAMの性能を超える精度と精密度の新しい基準を設定します。
  2. 画像と動画のための統合モデル:SAM2は、画像および動画全体のオブジェクトをセグメント化するための統合ソリューションを提供する最初のモデルです。この統合により、AIアーティストはさまざまなセグメンテーションタスクに単一のモデルを使用できるため、ワークフローが簡素化されます。
  3. 強化された動画セグメンテーション機能:SAM2は、特にオブジェクトの部分を追跡する動画オブジェクトセグメンテーションで優れた性能を発揮します。既存の動画セグメンテーションモデルを上回り、フレーム全体でオブジェクトをセグメント化する精度と一貫性を向上させます。
  4. Segment Aのハイライト。インタラクション時間の短縮:既存のインタラクティブな動画セグメンテーション方法と比較して、SAM2はユーザーからのインタラクション時間を短縮します。この効率性により、AIアーティストは創造的なビジョンに集中し、手動のセグメンテーションタスクに費やす時間を減らすことができます。
  5. シンプルなデザインと高速な推論:高度な機能を持ちながら、SAM2はシンプルなアーキテクチャデザインを維持し、高速な推論速度を提供します。これにより、AIアーティストはパフォーマンスや効率を損なうことなく、SAM2をワークフローにシームレスに統合できます。

Segment Anything V2 (SAM2)の動作方法

SAM2は、ターゲットオブジェクト情報をキャプチャするセッションごとのメモリモジュールを導入することにより、SAMのプロンプト可能な機能を動画に拡張します。これにより、一時的な消失があってもフレーム全体でオブジェクトを追跡できます。ストリーミングアーキテクチャは、動画フレームを1つずつ処理し、メモリモジュールが空のときにSAMのように動作します。これにより、リアルタイムの動画処理とSAMの機能の自然な一般化が可能になります。SAM2はまた、ユーザープロンプトに基づいたインタラクティブなマスク予測修正をサポートします。モデルは、ストリーミングメモリを備えたトランスフォーマーアーキテクチャを使用し、ユーザーインタラクションによってモデルとデータの両方を改善するモデルインザループデータエンジンを使用して収集された最大の動画セグメンテーションデータセットであるSA-Vデータセットでトレーニングされています。

ComfyUIでSegment Anything V2 (SAM2)を使用する方法

このComfyUIワークフローは、クリック/ポイントを使用して動画フレーム内のオブジェクトを選択することをサポートします。

1. 動画の読み込み(アップロード)

動画の読み込み: 処理したい動画を選択してアップロードします。

ComfyUI Segment Anything V2 (SAM2)

2. ポイントエディタ

キーポイント: キャンバスに3つのキーポイント—positive0、positive1、およびnegative0を配置します:

positive0とpositive1は、セグメント化したい領域またはオブジェクトをマークします。

negative0は不要な領域や気を散らすものを除外するのに役立ちます。

ComfyUI Segment Anything V2 (SAM2)

ポイントストア: セグメンテーションプロセスを洗練するために、必要に応じてポイントを追加または削除できます。

ComfyUI Segment Anything V2 (SAM2)

3. SAM2のモデル選択

モデルオプション: 利用可能なSAM2モデルから選択します:tiny、small、large、またはbase_plus。大きなモデルはより良い結果を提供しますが、ロード時間が長くなります。

ComfyUI Segment Anything V2 (SAM2)

詳細については、Kijai ComfyUI-segment-anything-2をご覧ください。

Want More ComfyUI Workflows?

SUPIR + Foolhardy Remacri | 8K画像/動画アップスケーラー

SUPIR + Foolhardy Remacri | 8K画像/動画アップスケーラー

SUPIRと4x Foolhardy Remacriモデルを使用して画像を8Kにアップスケールします。

HiDream E1.1 | AI 画像編集

HiDream E1.1 モデルを使用して自然言語で画像を編集

Face Detailer | 顔の修正

最初にFace Detailerを使用して顔の復元を行い、次に4x UltraSharp Modelを使用して優れたアップスケーリングを行います。

ファンタジーポートレート | 表現豊かな写真アニメーション

写真 → 表現豊かな映画的顔アニメーション、迅速かつアイデンティティに正確。

CogVideoX Tora | 画像から動画へのモデル

CogVideoXのための主題軌道ビデオデモ

SVD + FreeU | 画像からビデオへ

FreeUとSVDを組み合わせることで、追加コストなしで画像からビデオへの変換品質を改善します。

アンサンプリングを用いた一貫したスタイル転送

アンサンプリングによる潜在ノイズの制御は、ビデオスタイル転送の一貫性を劇的に向上させます。

DiffuEraser | ビデオインペインティング

自動マスキングとリアルな再構築でビデオからオブジェクトを消去します。

フォローする
  • LinkedIn
  • Facebook
  • Instagram
  • Twitter
サポート
  • Discord
  • メール
  • システムステータス
  • アフィリエイト
リソース
  • 無料のComfyUIオンライン
  • ComfyUIガイド
  • RunComfy API
  • ComfyUIチュートリアル
  • ComfyUIノード
  • 詳細を見る
法的情報
  • 利用規約
  • プライバシーポリシー
  • Cookieポリシー
RunComfy
著作権 2025 RunComfy. All Rights Reserved.

RunComfyは最高の ComfyUI プラットフォームです。次のものを提供しています: ComfyUIオンライン 環境とサービス、および ComfyUIワークフロー 魅力的なビジュアルが特徴です。 RunComfyはまた提供します AI Playground, アーティストが最新のAIツールを活用して素晴らしいアートを作成できるようにする。