影像的簡單視頻升級器是由 Mickmumpitz 開發的精簡 ComfyUI 管道,通過最少的設置提升現有視頻的清晰度、紋理和感知解析度。它結合了快速超解析度、細節友好的銳化和 Wan 2.x 擴散精緻化來恢復精細結構,同時保持運動自然。無論您是在現代化檔案記錄、改善 AI 生成的片段還是準備交付母帶,影像的簡單視頻升級器工作流程強調跨幀的一致性、批次之間的平滑過渡和可靠的輸出。
該工作流程接受單個輸入視頻,自動讀取其幀率,生成或接受指導提示,並在可混合的批次中處理幀,以確保長序列保持無縫。您可以為低 VRAM 系統選擇輕量級 GGUF 模型或選擇最大保真度的 FP8 UNet,然後通過簡單的創意控制來引導精緻化。最終結果保存為升級視頻,對於大型項目還可以選擇圖像序列路徑。
該管道從輸入到輸出遵循清晰的路徑,並將控制組織成組,以便您始終知道在哪裡調整質量、速度和內存行為。
此組初始化核心模型堆棧,讓您選擇 FP8 safetensors UNet 或 Wan 2.2 的 GGUF 量化 UNet。當 VRAM 緊張時使用 GGUF 路徑,當您想要最高保真度時使用 FP8 UNet。Wan 2.1 VAE 和 UMT5-XXL 文本編碼器在此處加載,以便提示可以引導後續的擴散步驟。如果您計劃使用 LoRA,請在運行前在此組加載它。
使用 VHS_LoadVideo (#130) 加載您的源片段。該工作流程通過 VHS_VideoInfo (#298) 讀取源幀率,以便最終渲染匹配運動節奏。設置目標寬度和高度,選擇是否啟用高品質模式,並調整創意控制以決定精緻化應如何嚴格遵循您的輸入。對於長片段,設置每次迭代的幀數和重疊值,以便批次平滑混合,並在需要最大穩定性或處理非常高解析度時啟用圖像序列保存選項。
您可以鍵入自定義提示,或讓工作流程為您構建一個。單幀由 Florence2Run (#147) 取樣並加上字幕,然後由 StringReplace (#408) 輕微重寫,並通過 JoinStrings (#339) 與任何自定義文本合併。合併後的提示由 ShowText|pysssss (#135) 顯示並傳遞給 Positive Prompt (#3),而 Negative Prompt (#4) 包含人工制品減少術語。這使提示保持一致且易於管理,特別是對於批量作業。
幀通過 ImageUpscaleWithModel (#303) 使用 RealESRGAN 預先升級,然後通過 ImageScale (#454) 精確調整到目標解析度。Image Sharpen FS (#452) 在需要時恢復邊緣銳利度,ImageAddNoise (#421) 添加小的受控噪聲,幫助擴散通過重建真實微紋理。WAN 模型通過 WanVideoNAG (#115) 和 ModelSamplingSD3 (#419) 準備,然後 UltimateSDUpscaleNoUpscale (#126) 執行平鋪、提示引導的精緻化,尊重全局結構和運動連續性。
長視頻自動分割為可混合的批次。此子圖計算迭代次數,顯示在“迭代次數”,並在考慮您的重疊設置時組裝每個圖像批次。在批次之間的邊界,ImageBatchJoinWithTransition (#244) 混合幀以使接縫不明顯。當切口明顯時使用更多重疊,當場景穩定時減少以加快速度。
當啟用“保存圖像序列”時,每次迭代將其幀寫入磁盤,這對於非常高解析度或內存有限非常有幫助。工作流程稍後通過 VHS_LoadImagesPath (#396) 重新加載這些幀,選擇性地再次混合批次末端並將它們組裝成連續序列。如果您停止並恢復處理,這條路徑提供了一個強大的恢復路線。
最終幀由 VHS_VideoCombine (#128) 使用先前捕獲的源幀率編譯成視頻,因此運動保持流暢並忠於原始。您還可以使用 VHS_VideoCombine (#393) 發布中間預覽或從保存的序列路徑寫入第二個最終。文件名和子文件夾自動遞增以保持每次運行整潔。
VHS_LoadVideo (#130)加載輸入片段,並暴露圖像、幀數和 video_info blob。如果您打算只處理一部分,請在節點中限制幀加載,並相應地對齊“每次迭代幀數”。保持加載器和批次設置同步可以防止當批次拼接時出現卡頓或缺口。
ImageUpscaleWithModel (#303)應用 RealESRGAN 進行快速、抗人工制品的尺寸提升,然後再進行擴散。使用它在精緻化之前達到或接近目標解析度,以便 WAN 通過可以專注於紋理和精細細節,而不是大規模調整大小。如果您的源已經符合目標大小,您仍然可以保留此階段以進行去噪和結構加強。
UltimateSDUpscaleNoUpscale (#126)在平鋪中運行 WAN 擴散精緻化,具有接縫修復和可選的平鋪解碼以保留全局結構。此處重要的控制項很少,主要是採樣器步驟、去噪強度和與接縫相關的選項;更高的步驟和去噪會產生更果斷的外觀,而較低的設置會更接近您的原始幀。當您在設置組中啟用高品質時,此節點會自動調整步驟深度。
WanVideoNAG (#115) 和 ModelSamplingSD3 (#419)這對將 WAN 模型掛接到採樣器,並暴露創意變化。較低的創意保持輸出接近輸入,並進行溫和增強,而較高的值會增加更多生成的紋理,並可以創造細節。對於紀錄片、採訪或檔案工作,建議使用保守值;對於合成或 AI 起源的片段,您可以進一步推進。
ImageBatchJoinWithTransition (#244)將一個批次的尾部與下一個批次的頭部混合以隱藏拼接痕跡。當您注意到亮度或紋理跳躍時增加過渡幀的數量,當場景均勻時減少以加快速度。這是保持影像的簡單視頻升級器管道在長時間軸上無縫的主要杠桿。
VHS_VideoCombine (#128)在上游捕獲的源幀率下組裝最終視頻。如果您保存了圖像序列,可以切換到替代的組合節點以從磁盤渲染,而不重新處理。此節點也是您在需要時設置容器和像素格式的地方。
此工作流程實施並建立在以下作品和資源之上。我們對 Mickmumpitz 為影像的簡單視頻升級器工作流程的貢獻和維護表示感謝。欲了解權威細節,請參閱以下鏈接的原始文檔和存儲庫。
注意: 使用所引用的模型、數據集和代碼需遵循其作者和維護者提供的相應許可和條款。
RunComfy 是首選的 ComfyUI 平台,提供 ComfyUI 在線 環境和服務,以及 ComfyUI 工作流程 具有驚豔的視覺效果。 RunComfy還提供 AI Playground, 幫助藝術家利用最新的AI工具創作出令人驚艷的藝術作品。