フッテージのための簡単なビデオアップスケーラーは、MickmumpitzによるComfyUIの効率的なパイプラインであり、最小限のセットアップで既存のビデオの明瞭さ、質感、見かけの解像度を向上させます。高速スーパー解像度、ディテールに優しいシャープ化、およびWan 2.x拡散リファインメントを組み合わせて、動きを自然に保ちながら微細な構造を復元します。アーカイブ記録の現代化、AI生成クリップの改善、または配送マスターの準備において、フッテージのための簡単なビデオアップスケーラーのワークフローは、フレーム全体の一貫性、バッチ間のスムーズな移行、および信頼性のある出力を強調します。
ワークフローは単一の入力ビデオを受け入れ、そのフレームレートを自動で読み取り、ガイドプロンプトを生成または受け入れ、長いシーケンスがシームレスに保たれるようにブレンド可能なバッチでフレームを処理します。低VRAMシステム用の軽量GGUFモデルまたは最大忠実度のFP8 UNetを選択し、シンプルなクリエイティビティコントロールでリファインメントを指導できます。最終結果はアップスケールされたビデオとして保存され、大規模プロジェクト用のオプションのイメージシーケンスパスがあります。
パイプラインは入力から出力までの明確なパスを辿り、コントロールをグループに整理して、常に品質、速度、メモリ動作を調整する場所を把握できます。
このグループはコアモデルスタックを初期化し、Wan 2.2用にFP8セーフテンソールUNetまたはGGUF量子化UNetのいずれかを選択できます。VRAMが厳しい場合はGGUFパスを使用し、最高の忠実度が必要な場合はFP8 UNetを使用します。Wan 2.1 VAEとUMT5-XXLテキストエンコーダーはここでロードされ、後の拡散ステップでプロンプトをガイドできます。LoRAを使用する予定がある場合は、実行前にこのグループでロードしてください。
VHS_LoadVideo (#130)でソースクリップをドロップします。ワークフローはVHS_VideoInfo (#298)を介してソースフレームレートを読み取り、最終レンダリングが動きのリズムに一致するようにします。目標の幅と高さを設定し、高品質モードを有効にするかどうかを選択し、リファインメントが入力にどれだけ厳密に従うべきかを決定するためにクリエイティビティコントロールを調整します。長いクリップの場合、フレームごとのイテレーション数とオーバーラップ値を設定してバッチをクリーンにブレンドし、最大の安定性を求めるか、非常に高解像度で作業している場合は、イメージシーケンス保存オプションを有効にします。
カスタムプロンプトを入力するか、ワークフローに作成させることができます。単一のフレームがサンプリングされ、Florence2Run (#147)によってキャプションされ、その後StringReplace (#408)によって軽く書き換えられ、JoinStrings (#339)を介してカスタムテキストとマージされます。結合されたプロンプトはShowText|pysssss (#135)によって表示され、Positive Prompt (#3)に渡されますが、Negative Prompt (#4)にはアーティファクト削減用の用語が含まれています。これにより、プロンプトが一貫して管理しやすく、特にバッチジョブで迅速に処理できます。
フレームはImageUpscaleWithModel (#303)を使用してRealESRGANで事前にアップスケールされ、その後ImageScale (#454)で目標解像度に正確にリサイズされます。必要に応じてImage Sharpen FS (#452)がエッジスナップを復元し、ImageAddNoise (#421)は拡散パスが現実的な微細テクスチャを再構築するのを助けるために小さな制御されたノイズを追加します。WANモデルはWanVideoNAG (#115)とModelSamplingSD3 (#419)で準備され、その後UltimateSDUpscaleNoUpscale (#126)がグローバル構造と動きの連続性を尊重しながら、タイル化されたプロンプトガイドのリファインメントを行います。
長いビデオは自動的にブレンド可能なバッチに分割されます。このサブグラフは、イテレーション数を計算し、“Number of Iterations”に表示し、オーバーラップ設定を考慮して各イメージバッチを組み立てます。バッチ間の境界では、ImageBatchJoinWithTransition (#244)がフレームをミックスして縫い目が目立たないようにします。カットが明らかな場合はオーバーラップを増やし、シーンが安定している場合は速度を上げるために減らします。
“Save Image Sequence”が有効な場合、各イテレーションはディスクにフレームを書き込みます。これは非常に高解像度またはメモリが限られている場合に役立ちます。ワークフローは後でVHS_LoadImagesPath (#396)でフレームを再ロードし、オプションでバッチの端を再びブレンドし、連続したシーケンスに組み立てます。このパスは、処理を停止して再開する場合に頑丈な回復ルートを提供します。
最終フレームは、ソースフレームレートを使用してVHS_VideoCombine (#128)によってビデオにコンパイルされるため、動きは滑らかで元のままです。中間プレビューを出力したり、保存されたシーケンスパスから二次的な最終を作成することもできます。ファイル名とサブフォルダは自動でインクリメントされ、各実行を整理します。
VHS_LoadVideo (#130)入力クリップをロードし、画像、フレーム数、およびvideo_infoブロブを公開します。処理する部分を絞る場合は、ノードでフレームロードを制限し、“Frames per Iteration”をそれに合わせて調整してください。ローダーとバッチ設定を同期させることで、バッチをステッチする際のスタッターやギャップを防ぎます。
ImageUpscaleWithModel (#303)拡散の前に素早くアーティファクトに強いサイズブーストを行うためにRealESRGANを適用します。WANパスがテクスチャーや微細なディテールに集中できるように、リファインメントの前に目標解像度に達するかそれに近づけるために使用します。ソースがすでに目標サイズに一致している場合でも、このステージを維持してノイズ除去や構造補強を行うことができます。
UltimateSDUpscaleNoUpscale (#126)WAN拡散リファインメントをタイルで実行し、シームフィクシングとオプションのタイル化デコードでグローバル構造を保持します。ここで重要なのはサンプラーステップ、デノイズ強度、シーム関連オプションです。ステップを高くし、デノイズを強くするとより主張的な外観になりますが、低い設定では元のフレームにより近くなります。設定グループで高品質を有効にすると、このノードは自動的にステップの深さを調整します。
WanVideoNAG (#115) と ModelSamplingSD3 (#419)このペアはWANモデルをサンプラーに接続し、クリエイティビティのシフトを公開します。低いクリエイティビティは出力を入力に近づけ、優しい強化を行いますが、高い値はより生成的なテクスチャーを追加し、詳細を発明することができます。ドキュメンタリー、インタビュー、またはアーカイブ作業の場合は保守的な値を好み、合成またはAI由来のクリップの場合はもう少し押しても構いません。
ImageBatchJoinWithTransition (#244)一つのバッチの末尾を次のバッチの先頭とブレンドしてステッチマークを隠します。輝度やテクスチャージャンプが見られる場合は、トランジションフレームの数を増やし、シーンが均一な場合は速度を上げるために減らします。これが長いタイムラインでフッテージのための簡単なビデオアップスケーラーパイプラインをシームレスに保つ主要なレバーです。
VHS_VideoCombine (#128)上流でキャプチャされたソースfpsで最終ビデオを組み立てます。イメージシーケンスを保存した場合は、ディスクからレンダリングするために代替のコンバインノードに切り替えて再処理せずに出力できます。このノードはまた、必要に応じてコンテナとピクセルフォーマットを設定する場所です。
このワークフローは以下の作品とリソースを実装し、構築しています。フッテージのための簡単なビデオアップスケーラーワークフローを提供してくれたMickmumpitzに感謝します。権威ある詳細については、以下にリンクされたオリジナルのドキュメントとリポジトリを参照してください。
Note: Use of the referenced models, datasets, and code is subject to the respective licenses and terms provided by their authors and maintainers.
RunComfyは最高の ComfyUI プラットフォームです。次のものを提供しています: ComfyUIオンライン 環境とサービス、および ComfyUIワークフロー 魅力的なビジュアルが特徴です。 RunComfyはまた提供します AI Playground, アーティストが最新のAIツールを活用して素晴らしいアートを作成できるようにする。