ComfyUI 中影像的簡單視頻升級器

影像的簡單視頻升級器

影像的簡單視頻升級器是由 Mickmumpitz 開發的精簡 ComfyUI 管道，通過最少的設置提升現有視頻的清晰度、紋理和感知解析度。它結合了快速超解析度、細節友好的銳化和 Wan 2.x 擴散精緻化來恢復精細結構，同時保持運動自然。無論您是在現代化檔案記錄、改善 AI 生成的片段還是準備交付母帶，影像的簡單視頻升級器工作流程強調跨幀的一致性、批次之間的平滑過渡和可靠的輸出。

該工作流程接受單個輸入視頻，自動讀取其幀率，生成或接受指導提示，並在可混合的批次中處理幀，以確保長序列保持無縫。您可以為低 VRAM 系統選擇輕量級 GGUF 模型或選擇最大保真度的 FP8 UNet，然後通過簡單的創意控制來引導精緻化。最終結果保存為升級視頻，對於大型項目還可以選擇圖像序列路徑。

ComfyUI 影像的簡單視頻升級器工作流程中的關鍵模型

Wan 2.2 T2V Low Noise 14B UNet (FP8 或 GGUF)。核心生成骨幹，用於基於擴散的細節增強，同時尊重來源幀。 Hugging Face: Comfy-Org/Wan_2.2_ComfyUI_Repackaged 和 Hugging Face: bullerwins/Wan2.2-T2V-A14B-GGUF
Wan 2.1 VAE。在精緻化過程中，在潛在空間和像素空間之間移動時保留紋理和色調的解碼器。 Hugging Face: Comfy-Org/Wan_2.1_ComfyUI_repackaged
UMT5-XXL 文本編碼器 (FP8)。用於提示調節的文本骨幹，使指令與 WAN 模型對齊。包含在 Wan 2.1 重新打包資產中。 Hugging Face: Comfy-Org/Wan_2.1_ComfyUI_repackaged
RealESRGAN x2。經典的超解析度模型，在基於擴散的細節恢復之前，清晰地提升幀大小。 GitHub: xinntao/Real-ESRGAN
Microsoft Florence-2 Large。此處使用的視覺語言模型，用於自動為代表性幀添加字幕，當您不想撰寫提示時提供高品質的提示。 Hugging Face: microsoft/Florence-2-large
WAN 2.2 的可選 LoRA 附加模塊。輕量級適配器，可以在不壓倒影像的情況下將精緻化引導至特定外觀。例如，“Lightning” 低噪音 4 步 LoRA。 Hugging Face: lightx2v/Wan2.2-Lightning

如何使用 ComfyUI 影像的簡單視頻升級器工作流程

該管道從輸入到輸出遵循清晰的路徑，並將控制組織成組，以便您始終知道在哪裡調整質量、速度和內存行為。

模型加載器

此組初始化核心模型堆棧，讓您選擇 FP8 safetensors UNet 或 Wan 2.2 的 GGUF 量化 UNet。當 VRAM 緊張時使用 GGUF 路徑，當您想要最高保真度時使用 FP8 UNet。Wan 2.1 VAE 和 UMT5-XXL 文本編碼器在此處加載，以便提示可以引導後續的擴散步驟。如果您計劃使用 LoRA，請在運行前在此組加載它。

輸入視頻和設置

使用 VHS_LoadVideo (#130) 加載您的源片段。該工作流程通過 VHS_VideoInfo (#298) 讀取源幀率，以便最終渲染匹配運動節奏。設置目標寬度和高度，選擇是否啟用高品質模式，並調整創意控制以決定精緻化應如何嚴格遵循您的輸入。對於長片段，設置每次迭代的幀數和重疊值，以便批次平滑混合，並在需要最大穩定性或處理非常高解析度時啟用圖像序列保存選項。

提示

您可以鍵入自定義提示，或讓工作流程為您構建一個。單幀由 Florence2Run (#147) 取樣並加上字幕，然後由 StringReplace (#408) 輕微重寫，並通過 JoinStrings (#339) 與任何自定義文本合併。合併後的提示由 ShowText|pysssss (#135) 顯示並傳遞給 Positive Prompt (#3)，而 Negative Prompt (#4) 包含人工制品減少術語。這使提示保持一致且易於管理，特別是對於批量作業。

升級生成

幀通過 ImageUpscaleWithModel (#303) 使用 RealESRGAN 預先升級，然後通過 ImageScale (#454) 精確調整到目標解析度。Image Sharpen FS (#452) 在需要時恢復邊緣銳利度，ImageAddNoise (#421) 添加小的受控噪聲，幫助擴散通過重建真實微紋理。WAN 模型通過 WanVideoNAG (#115) 和 ModelSamplingSD3 (#419) 準備，然後 UltimateSDUpscaleNoUpscale (#126) 執行平鋪、提示引導的精緻化，尊重全局結構和運動連續性。

批次創建者 + 混合生成批次

長視頻自動分割為可混合的批次。此子圖計算迭代次數，顯示在“迭代次數”，並在考慮您的重疊設置時組裝每個圖像批次。在批次之間的邊界，ImageBatchJoinWithTransition (#244) 混合幀以使接縫不明顯。當切口明顯時使用更多重疊，當場景穩定時減少以加快速度。

輸出混合保存的圖像序列

當啟用“保存圖像序列”時，每次迭代將其幀寫入磁盤，這對於非常高解析度或內存有限非常有幫助。工作流程稍後通過 VHS_LoadImagesPath (#396) 重新加載這些幀，選擇性地再次混合批次末端並將它們組裝成連續序列。如果您停止並恢復處理，這條路徑提供了一個強大的恢復路線。

輸出

最終幀由 VHS_VideoCombine (#128) 使用先前捕獲的源幀率編譯成視頻，因此運動保持流暢並忠於原始。您還可以使用 VHS_VideoCombine (#393) 發布中間預覽或從保存的序列路徑寫入第二個最終。文件名和子文件夾自動遞增以保持每次運行整潔。

ComfyUI 影像的簡單視頻升級器工作流程中的關鍵節點

`VHS_LoadVideo` (#130)

加載輸入片段，並暴露圖像、幀數和 video_info blob。如果您打算只處理一部分，請在節點中限制幀加載，並相應地對齊“每次迭代幀數”。保持加載器和批次設置同步可以防止當批次拼接時出現卡頓或缺口。

`ImageUpscaleWithModel` (#303)

應用 RealESRGAN 進行快速、抗人工制品的尺寸提升，然後再進行擴散。使用它在精緻化之前達到或接近目標解析度，以便 WAN 通過可以專注於紋理和精細細節，而不是大規模調整大小。如果您的源已經符合目標大小，您仍然可以保留此階段以進行去噪和結構加強。

`UltimateSDUpscaleNoUpscale` (#126)

在平鋪中運行 WAN 擴散精緻化，具有接縫修復和可選的平鋪解碼以保留全局結構。此處重要的控制項很少，主要是採樣器步驟、去噪強度和與接縫相關的選項；更高的步驟和去噪會產生更果斷的外觀，而較低的設置會更接近您的原始幀。當您在設置組中啟用高品質時，此節點會自動調整步驟深度。

`WanVideoNAG` (#115) 和 `ModelSamplingSD3` (#419)

這對將 WAN 模型掛接到採樣器，並暴露創意變化。較低的創意保持輸出接近輸入，並進行溫和增強，而較高的值會增加更多生成的紋理，並可以創造細節。對於紀錄片、採訪或檔案工作，建議使用保守值；對於合成或 AI 起源的片段，您可以進一步推進。

`ImageBatchJoinWithTransition` (#244)

將一個批次的尾部與下一個批次的頭部混合以隱藏拼接痕跡。當您注意到亮度或紋理跳躍時增加過渡幀的數量，當場景均勻時減少以加快速度。這是保持影像的簡單視頻升級器管道在長時間軸上無縫的主要杠桿。

`VHS_VideoCombine` (#128)

在上游捕獲的源幀率下組裝最終視頻。如果您保存了圖像序列，可以切換到替代的組合節點以從磁盤渲染，而不重新處理。此節點也是您在需要時設置容器和像素格式的地方。

可選附加

選擇一個 WAN 路徑。在強大的 GPU 上使用 FP8 UNet 以獲得最佳質量，或在低 VRAM 的工作站和筆記本電腦上使用 GGUF UNet。
保持運動自然。對於真人或紀錄片影像，從低創意開始，然後逐漸增加，如果您需要更多紋理恢復。
事先計劃批次。對於長片段，啟用“保存圖像序列”，以便您可以在不重新計算擴散的情況下恢復或重新渲染最終。
匹配幀數學。設置每次迭代的幀數，以便它與加載器的上限和重疊對齊；影像的簡單視頻升級器批次工具將為您計算迭代次數並混合邊緣。
謹慎使用 LoRA。當您需要特定外觀時添加 WAN 2.2 LoRA，如果它開始壓倒場景的原始特性則降低其權重。

致謝

此工作流程實施並建立在以下作品和資源之上。我們對 Mickmumpitz 為影像的簡單視頻升級器工作流程的貢獻和維護表示感謝。欲了解權威細節，請參閱以下鏈接的原始文檔和存儲庫。

資源

YouTube/影像的簡單視頻升級器
- 文檔 / 版本說明: YouTube @ Mickmumpitz

注意: 使用所引用的模型、數據集和代碼需遵循其作者和維護者提供的相應許可和條款。

Want More ComfyUI Workflows?

FlashVSR | 即時影片升級器

快速、平滑且超清晰地升級影片——不丟失細節。

SUPIR + Foolhardy Remacri | 8K 圖像/視頻升級器

使用 SUPIR 和 4x Foolhardy Remacri 模型將圖像升級至 8K。

SUPIR | 照片真實感影像/視頻放大器

SUPIR 啟用照片真實感影像修復，兼容 SDXL 模型，並支持文本提示增強。

CCSR | 一致性影像/視頻放大器

CCSR 模型透過更專注於內容一致性來增強影像和視頻的放大效果。

APISR | 動漫圖像/影片放大器

APISR 模型增強和恢復動漫圖像和影片，使您的視覺效果更生動清晰。

Stable Diffusion 3.5 vs FLUX.1

在一個ComfyUI工作流程中比較Stable Diffusion 3.5和FLUX.1。

FLUX Img2Img | 合併視覺效果和提示

合併視覺效果和提示，獲得驚人的增強結果。

LayerDiffuse | 文字轉透明圖像

使用 LayerDiffuse 生成透明圖像或將背景與前景相互融合。

關注我們

支持

資源

法律

RunComfy

RunComfy 是首選的 ComfyUI 平台，提供 ComfyUI 在線環境和服務，以及 ComfyUI 工作流程具有驚豔的視覺效果。 RunComfy還提供 AI Models, 幫助藝術家利用最新的AI工具創作出令人驚艷的藝術作品。

影像的簡單視頻升級器 | 專業高清增強