ComfyUI Phantom | Subject to Video
ComfyUI Phantomは、既存のテキストからビデオ、画像からビデオアーキテクチャを基にした、単一および複数の被写体参照向けの統一ビデオ生成フレームワークです。テキスト-画像-ビデオの三つ組データを使用してクロスモーダルアラインメントを達成し、共同テキスト-画像インジェクションモデルを再設計しています。さらに、IDを維持しながら人間の生成における被写体の一貫性を強調しています。 簡単に言えば、ComfyUI Phantomは参照画像とテキストプロンプトに基づいてビデオを生成することができ、アイデンティティを一貫して保つ人間のビデオ合成に最適です。ComfyUI Phantom Workflow
ComfyUI Phantom Examples
ComfyUI Phantom Description
ComfyUI Phantom: Subject to Video
ComfyUI Phantomは、ComfyUIワークフロー環境に統合された強力な一貫性のある被写体からビデオ生成モデルです。このComfyUI Phantomの実装により、1つまたは複数の参照画像から高品質でアイデンティティを一貫して保持するビデオ合成が可能となります。
高度なテキストからビデオ、画像からビデオのアーキテクチャに基づいて構築され、ComfyUI Phantomは被写体のアイデンティティを維持しながら人間中心の動作を生成することに特化しています。統一された共同テキスト-画像インジェクションアプローチを通じて、ComfyUI Phantomは正確なクロスモーダルアラインメントを達成し、提供された参照の構造と外観に従った表現力豊かでフレーム一貫性のある出力を保証します。
なぜComfyUI Phantomを使用するのか?
ComfyUI Phantomが提供するもの:
- 参照ベースの生成: ComfyUI Phantomワークフローで被写体の外観を指示するために、1つまたは複数の参照画像を入力
- プロンプト + 画像のコントロール: 創造的なテキスト説明と画像の忠実度をComfyUI Phantomノードでブレンド
- アイデンティティの維持: ComfyUI Phantomはフレーム間で被写体の一貫性を維持
- 複数被写体のサポート: 参照入力を使用して複数の被写体を含むビデオを生成
- ComfyUIの統合: 既存のComfyUIワークフローおよびカスタムノードとシームレスに統合
- クリエイターに最適: ComfyUI Phantomを使用するVTuber、スタイライズされたキャラクタークリエイター、物語ビデオアーティストに最適
キャラクターをアニメーション化するか、参照駆動のAIモーションを生成するかに関わらず、ComfyUI PhantomはComfyUIエコシステム内での視覚的ストーリーテリングのための柔軟で強力なツールキットを提供します。
1 - ComfyUI Phantomでの参照
最初のセクションでは、ComfyUI Phantomセットアップのための参照アップロードを処理します:
ComfyUI Phantomワークフローでここに運転参照画像をロードします。それぞれのグループに最大4つの参照画像をアップロードできます。デフォルトではComfyUI Phantomで2つが有効化されており、2つをアンミュートすることでさらに有効化できます。
比較ビデオ出力で比較の更新を確認するには、Image concate multi nodeでもそれらを有効にする必要があります。
2 - ComfyUI Phantomの解像度と期間設定
これらのComfyUI Phantomノードにwan 2.1互換の解像度とフレームの期間を入力します。
3 - ComfyUI Phantomにおけるプロンプト設定
ComfyUI Phantomビデオ生成のためのプロンプトを入力します:
- ポジティブプロンプト: アップロードした参照画像の内容と一致するようにPhantomに生成してほしいものを説明
- ネガティブプロンプト: Phantomが避けるべきものを説明(例:「ぼやけた、低品質、アーティファクト」)
4 - ComfyUI PhantomにおけるKSamplerと出力
- サンプラー設定: Phantom生成のためのサンプラータイプ(例:DPM++、Eulerなど)、ステップ、およびシードを選択
- 出力: 生成された画像はPhantom出力ビューアに表示され、出力フォルダに保存されます
- ComfyUI Phantomモデルの読み込み: Phantomモデルセレクターノードで、1.3Bまたは14BのComfyUI Phantomモデルを選択できます
レンダリングされたビデオはComfyUIインストールの出力フォルダに保存されます。
ComfyUI Phantomワークフローの利点
ComfyUI Phantomはビデオ生成においていくつかの利点を提供します:
- ノードベースのインターフェース: ComfyUIの直感的なノードシステムを活用してComfyUI Phantomワークフローを操作
- ワークフローカスタマイズ: ComfyUI Phantomワークフローを特定のニーズに合わせて変更および拡張
- パラメーターコントロール: 正確なパラメーター調整でComfyUI Phantom生成を微調整
- バッチ処理: ComfyUI Phantomを使用して複数の参照画像を効率的に処理
- コミュニティサポート: 共有されたComfyUI Phantomワークフローおよびコミュニティの変更にアクセス
謝辞
ComfyUI Phantomは、ComfyUI内でのWan 2.1ビデオ生成モデルを用いたWan Video Wrapperノードシステムに基づいて構築されています。コアノードとアーキテクチャはによって開発され、ComfyUI内で参照ベースのIDを維持するビデオ合成を可能にします。このComfyUI Phantomワークフローは、Wan 2.1とそれを駆動するカスタムComfyUIツールの基礎的な作業なしでは不可能でした。
ComfyUI Phantomモデル情報
- ソース -
- ComfyUI実装: https://huggingface.co/Kijai/WanVideo_comfy/tree/main
- アーキテクチャ: ComfyUI Phantomのためのマルチ入力参照
- モデルの場所:
comfyui/models/diffusion_models
- ComfyUI互換性: ComfyUIワークフローシステムと完全に統合