FlashVSR 在 ComfyUI 工作流 | 实时视频修复

FlashVSR 视频超分辨率用于 ComfyUI：超快速修复、流媒体质量和 WanVideo 集成

此工作流将 FlashVSR 引入 ComfyUI，并提供三种可直接运行的路径：用于快速周转的超快速放大器、用于更高保真度的流媒体质量采样器以及融合 FlashVSR 调节和文本到视频骨干的 WanVideo 集成路线。它专为需要实时视频超分辨率和修复的编辑、调色师和创作者而设计，同时保持时间一致性。

FlashVSR 使用一步扩散、局部约束稀疏注意和一个小型条件解码器，在最小计算量下放大和清理低分辨率或 AI 生成的素材。图形保留您的音频，提供并排比较渲染，并为每个分支写入单独的交付文件，以便您选择最佳结果。

Comfyui FlashVSR 工作流中的关键模型

FlashVSR (Ultra Fast)。轻量化实现，优化用于一步扩散和实时推理；理想用于快速增强和实时预览。参见 ComfyUI Ultra Fast 实现中的插件和说明 here。
FlashVSR (Streaming/SM weights)。具有小型条件解码器的高保真变体，用于稳健的时间细节和修复；由 KSampler 分支使用。核心节点实现和权重记录在 ComfyUI FlashVSR 仓库 here。
Wan 2.1 text-to-video 1.3B (FlashVSR-tuned)。为接受 FlashVSR 调节而准备的 WanVideo 骨干，用于 Wan 采样器内部的一步修复；通过 FlashVSR TCDecoder 提供解码。
uMT5-XXL text encoder。提供文本嵌入到 Wan 采样器中，当使用提示时；模型参考：google/umt5-xxl。

如何使用 Comfyui FlashVSR 工作流

概述：加载源剪辑，然后选择一个或多个分支进行渲染。所有分支继承相同的输入和音频，并且可以独立运行，生成各自的输出文件和可选比较视频。

全局参数

VHS_LoadVideo (#123) 加载您的源剪辑并将音频传递给每个渲染器以保留声音。VHS_VideoInfo (#129) 暴露 FPS 以确保一致的导出。两个辅助节点，“Before Resize” GetImageSizeAndCount (#162) 和 “After Resize” GetImageSizeAndCount (#163)，报告尺寸和帧数，因此您始终知道每个分支正在处理什么。
LayerUtility: ImageScaleByAspectRatio V2 (#140, #154, #155) 使用信箱缩放为每个路径标准化帧。为每个分支选择您的长边目标，以控制质量和速度之间的权衡。

FlashVSR 超快速

此路径优先考虑吞吐量，同时保留 FlashVSR 特有的时间稳定性。帧被调整大小（ImageScaleByAspectRatio V2 (#154)）并发送到两个 FlashVSRNode (#152 设置为“full”，#143 设置为“tiny”) 变体，以便您可以比较速度和锐度。
每个变体通过 VHS_VideoCombine (#144 和 #153) 撰写自己的视频，并通过音频传递。需要快速客户检查、放大日常或快速 AI 素材清理时使用此功能。

FlashVSR_SM_KSampler

流媒体分支旨在使用 FlashVSR SM 权重实现更高保真度。两个 FlashVSR_SM_Model 加载器 (#158 带 TCDecoder, #150 不带) 为两个 FlashVSR_SM_KSampler 传递 (#146 和 #148) 提供 A/B 比较用于具有挑战性的素材。
帧被调整到工作分辨率（ImageScaleByAspectRatio V2 (#155)），然后在 Pass 1 和 Pass 2 中处理。LayerUtility: PurgeVRAM V2 (#145, #147) 在通过之间释放内存，以确保有限 GPU 的稳定性。
每次通过写入一个结果（VHS_VideoCombine #157 “Pass_1”, #156 “Pass_2”）。两个比较作曲家（ImageConcanate #165 和 #167）生成源与结果的并排视频（VHS_VideoCombine #166, #168），以便您可以快速判断要保留的通过。

KJ Wan Flash VSR

此路由将 FlashVSR 调节注入到 WanVideo 采样器中，以通过可选文本提示进行一步修复。WanVideoModelLoader (#22) 加载 FlashVSR 调谐的 Wan 模型，而 LoadWanVideoT5TextEncoder (#11) 和 WanVideoTextEncode (#104) 提供提示嵌入，如果您想要风格指导。
您的帧被调整大小（ImageScaleByAspectRatio V2 (#140)），然后 WanVideoEmptyEmbeds (#78) 设置正确的宽度、高度和帧数。WanVideoAddFlashVSRInput (#114) 将准备好的图像与采样器期望的 FlashVSR 嵌入融合。
WanVideoSampler (#27) 执行一步推理；WanVideoDecode (#121) 使用 FlashVSR TCDecoder 加载器 (#119) 重建帧。ColorMatch (#142) 阶段恢复原始外观，后跟一个可选的并排连接（ImageConcatMulti #117）。最终输出通过 VHS_VideoCombine (#135, #30) 写入。

Comfyui FlashVSR 工作流中的关键节点

FlashVSRNode (#152, full)

“full” 模式下的核心超快速放大器。调整 scale 以进行 2x/4x 工作，启用 color_fix 以稳定亮度，并在较大分辨率下工作时使用 tiled_vae 或 tiled_dit。仅在您看到运动柔化或时间漂移时调整 sparse_ratio、kv_ratio 和 local_range。实现参考：ComfyUI-FlashVSR_Ultra_Fast。

FlashVSRNode (#143, tiny)

超快速“tiny”模式，最大速度。用于预览或非常长的序列。与完整节点相同的控制，但预期微细节略微柔和。参考：ComfyUI-FlashVSR_Ultra_Fast。

FlashVSR_SM_KSampler (#146, Pass 1)

与启用 TCDecoder 的模型配对的流媒体质量采样器 (#158)。首先设置 scale，然后平衡 cfg 和 steps 以实现细节与速度的平衡。如果 VRAM 在高分辨率下紧张，启用 full_tiled 并减少 split_num。实现细节和权重：ComfyUI_FlashVSR。

FlashVSR_SM_KSampler (#148, Pass 2)

第二次流媒体传递，具有补充模型设置 (#150)。用于在相同帧上测试替代 TCDecoder/嵌入组合。在您希望进行受控 A/B 时，保持通过之间的 kv_ratio 和 local_range 一致。

WanVideoAddFlashVSRInput (#114)

将您的预处理帧作为 FlashVSR 调节桥接到 Wan 采样器中。strength 控制确定 FlashVSR 修复相对于任何提示影响的应用程度。当源非常压缩或 AI 生成时增加强度。

WanVideoSampler (#27)

Wan 管道内的一步推理。如果您使用提示，请从中性开始，避免强烈的负面列表；让 FlashVSR 处理修复，而文本轻微推动色调或场景解释。在此路线上保持 steps 为 1，以实现真正的 FlashVSR 行为。

ColorMatch (#142)

在修复后将颜色协调回源。用于避免意外的色调或伽马偏移，尤其是在导出比较时。

可选附加功能

选择分支
- 使用 FlashVSR 超快速进行实时编辑、快速日常或长时间运行。
- 在需要额外稳健性处理噪声、压缩或闪烁素材时使用 FlashVSR SM KSampler。
- 在 Wan 采样器内使用轻提示指导进行一步修复时使用 KJ Wan Flash VSR。
VRAM 卫生
- 流媒体分支包括显式 VRAM 清除以确保稳定性。如果您链接长镜头，请保持启用状态。
比较和交付
- 工作流写入每个分支的输出加上并排比较。首先查看“Compare_”文件，然后保留看起来最适合您场景的传递。
参考
- 超快速实现：ComfyUI-FlashVSR_Ultra_Fast
- FlashVSR 节点和 SM 采样器：ComfyUI_FlashVSR
- uMT5-XXL 编码器：google/umt5-xxl

鸣谢

此工作流实现并构建在以下作品和资源的基础上。我们诚挚感谢 smthemex 为 ComfyUI FlashVSR 节点（FlashVSR Source）和 lihaoyun6 为 ComfyUI FlashVSR Ultra Fast 节点（FlashVSR Ultra Fast）做出的贡献和维护。有关权威细节，请参阅下面链接的原始文档和仓库。