logo
RunComfy
ComfyUIPlaygroundPricing
discord logo
ComfyUI>工作流>FlashVSR | 实时视频放大器

FlashVSR | 实时视频放大器

Workflow Name: RunComfy/FlashVSR
Workflow ID: 0000...1303
此工作流帮助您将任何低分辨率或 AI 生成的视频转换为清晰的高清镜头。使用先进的扩散和稀疏注意机制,它在保持平滑运动的同时恢复细节和锐度。非常适合视觉创作者,它简化了后期制作和视频增强。您可以控制精细纹理并在速度和质量之间取得平衡。轻松放大您的剪辑,同时保持一致的结果。非常适合快速、高质量的视频修复任务。

FlashVSR 视频超分辨率用于 ComfyUI:超快速修复、流媒体质量和 WanVideo 集成

此工作流将 FlashVSR 引入 ComfyUI,并提供三种可直接运行的路径:用于快速周转的超快速放大器、用于更高保真度的流媒体质量采样器以及融合 FlashVSR 调节和文本到视频骨干的 WanVideo 集成路线。它专为需要实时视频超分辨率和修复的编辑、调色师和创作者而设计,同时保持时间一致性。

FlashVSR 使用一步扩散、局部约束稀疏注意和一个小型条件解码器,在最小计算量下放大和清理低分辨率或 AI 生成的素材。图形保留您的音频,提供并排比较渲染,并为每个分支写入单独的交付文件,以便您选择最佳结果。

Comfyui FlashVSR 工作流中的关键模型

  • FlashVSR (Ultra Fast)。轻量化实现,优化用于一步扩散和实时推理;理想用于快速增强和实时预览。参见 ComfyUI Ultra Fast 实现中的插件和说明 here。
  • FlashVSR (Streaming/SM weights)。具有小型条件解码器的高保真变体,用于稳健的时间细节和修复;由 KSampler 分支使用。核心节点实现和权重记录在 ComfyUI FlashVSR 仓库 here。
  • Wan 2.1 text-to-video 1.3B (FlashVSR-tuned)。为接受 FlashVSR 调节而准备的 WanVideo 骨干,用于 Wan 采样器内部的一步修复;通过 FlashVSR TCDecoder 提供解码。
  • uMT5-XXL text encoder。提供文本嵌入到 Wan 采样器中,当使用提示时;模型参考:google/umt5-xxl。

如何使用 Comfyui FlashVSR 工作流

概述:加载源剪辑,然后选择一个或多个分支进行渲染。所有分支继承相同的输入和音频,并且可以独立运行,生成各自的输出文件和可选比较视频。

全局参数

  • VHS_LoadVideo (#123) 加载您的源剪辑并将音频传递给每个渲染器以保留声音。VHS_VideoInfo (#129) 暴露 FPS 以确保一致的导出。两个辅助节点,“Before Resize” GetImageSizeAndCount (#162) 和 “After Resize” GetImageSizeAndCount (#163),报告尺寸和帧数,因此您始终知道每个分支正在处理什么。
  • LayerUtility: ImageScaleByAspectRatio V2 (#140, #154, #155) 使用信箱缩放为每个路径标准化帧。为每个分支选择您的长边目标,以控制质量和速度之间的权衡。

FlashVSR 超快速

  • 此路径优先考虑吞吐量,同时保留 FlashVSR 特有的时间稳定性。帧被调整大小(ImageScaleByAspectRatio V2 (#154))并发送到两个 FlashVSRNode (#152 设置为“full”,#143 设置为“tiny”) 变体,以便您可以比较速度和锐度。
  • 每个变体通过 VHS_VideoCombine (#144 和 #153) 撰写自己的视频,并通过音频传递。需要快速客户检查、放大日常或快速 AI 素材清理时使用此功能。

FlashVSR_SM_KSampler

  • 流媒体分支旨在使用 FlashVSR SM 权重实现更高保真度。两个 FlashVSR_SM_Model 加载器 (#158 带 TCDecoder, #150 不带) 为两个 FlashVSR_SM_KSampler 传递 (#146 和 #148) 提供 A/B 比较用于具有挑战性的素材。
  • 帧被调整到工作分辨率(ImageScaleByAspectRatio V2 (#155)),然后在 Pass 1 和 Pass 2 中处理。LayerUtility: PurgeVRAM V2 (#145, #147) 在通过之间释放内存,以确保有限 GPU 的稳定性。
  • 每次通过写入一个结果(VHS_VideoCombine #157 “Pass_1”, #156 “Pass_2”)。两个比较作曲家(ImageConcanate #165 和 #167)生成源与结果的并排视频(VHS_VideoCombine #166, #168),以便您可以快速判断要保留的通过。

KJ Wan Flash VSR

  • 此路由将 FlashVSR 调节注入到 WanVideo 采样器中,以通过可选文本提示进行一步修复。WanVideoModelLoader (#22) 加载 FlashVSR 调谐的 Wan 模型,而 LoadWanVideoT5TextEncoder (#11) 和 WanVideoTextEncode (#104) 提供提示嵌入,如果您想要风格指导。
  • 您的帧被调整大小(ImageScaleByAspectRatio V2 (#140)),然后 WanVideoEmptyEmbeds (#78) 设置正确的宽度、高度和帧数。WanVideoAddFlashVSRInput (#114) 将准备好的图像与采样器期望的 FlashVSR 嵌入融合。
  • WanVideoSampler (#27) 执行一步推理;WanVideoDecode (#121) 使用 FlashVSR TCDecoder 加载器 (#119) 重建帧。ColorMatch (#142) 阶段恢复原始外观,后跟一个可选的并排连接(ImageConcatMulti #117)。最终输出通过 VHS_VideoCombine (#135, #30) 写入。

Comfyui FlashVSR 工作流中的关键节点

FlashVSRNode (#152, full)

  • “full” 模式下的核心超快速放大器。调整 scale 以进行 2x/4x 工作,启用 color_fix 以稳定亮度,并在较大分辨率下工作时使用 tiled_vae 或 tiled_dit。仅在您看到运动柔化或时间漂移时调整 sparse_ratio、kv_ratio 和 local_range。实现参考:ComfyUI-FlashVSR_Ultra_Fast。

FlashVSRNode (#143, tiny)

  • 超快速“tiny”模式,最大速度。用于预览或非常长的序列。与完整节点相同的控制,但预期微细节略微柔和。参考:ComfyUI-FlashVSR_Ultra_Fast。

FlashVSR_SM_KSampler (#146, Pass 1)

  • 与启用 TCDecoder 的模型配对的流媒体质量采样器 (#158)。首先设置 scale,然后平衡 cfg 和 steps 以实现细节与速度的平衡。如果 VRAM 在高分辨率下紧张,启用 full_tiled 并减少 split_num。实现细节和权重:ComfyUI_FlashVSR。

FlashVSR_SM_KSampler (#148, Pass 2)

  • 第二次流媒体传递,具有补充模型设置 (#150)。用于在相同帧上测试替代 TCDecoder/嵌入组合。在您希望进行受控 A/B 时,保持通过之间的 kv_ratio 和 local_range 一致。

WanVideoAddFlashVSRInput (#114)

  • 将您的预处理帧作为 FlashVSR 调节桥接到 Wan 采样器中。strength 控制确定 FlashVSR 修复相对于任何提示影响的应用程度。当源非常压缩或 AI 生成时增加强度。

WanVideoSampler (#27)

  • Wan 管道内的一步推理。如果您使用提示,请从中性开始,避免强烈的负面列表;让 FlashVSR 处理修复,而文本轻微推动色调或场景解释。在此路线上保持 steps 为 1,以实现真正的 FlashVSR 行为。

ColorMatch (#142)

  • 在修复后将颜色协调回源。用于避免意外的色调或伽马偏移,尤其是在导出比较时。

可选附加功能

  • 选择分支
    • 使用 FlashVSR 超快速进行实时编辑、快速日常或长时间运行。
    • 在需要额外稳健性处理噪声、压缩或闪烁素材时使用 FlashVSR SM KSampler。
    • 在 Wan 采样器内使用轻提示指导进行一步修复时使用 KJ Wan Flash VSR。
  • VRAM 卫生
    • 流媒体分支包括显式 VRAM 清除以确保稳定性。如果您链接长镜头,请保持启用状态。
  • 比较和交付
    • 工作流写入每个分支的输出加上并排比较。首先查看“Compare_”文件,然后保留看起来最适合您场景的传递。
  • 参考
    • 超快速实现:ComfyUI-FlashVSR_Ultra_Fast
    • FlashVSR 节点和 SM 采样器:ComfyUI_FlashVSR
    • uMT5-XXL 编码器:google/umt5-xxl

鸣谢

此工作流实现并构建在以下作品和资源的基础上。我们诚挚感谢 smthemex 为 ComfyUI FlashVSR 节点(FlashVSR Source)和 lihaoyun6 为 ComfyUI FlashVSR Ultra Fast 节点(FlashVSR Ultra Fast)做出的贡献和维护。有关权威细节,请参阅下面链接的原始文档和仓库。

资源

  • FlashVSR Source
    • GitHub: smthemex/ComfyUI_FlashVSR
  • FlashVSR Ultra Fast
    • GitHub: lihaoyun6/ComfyUI-FlashVSR_Ultra_Fast

注意:参考模型、数据集和代码的使用受其作者和维护者提供的各自许可和条款的约束。

Want More ComfyUI Workflows?

Flux Consistent Characters | Input Image

Flux Consistent Characters | Input Image

使用您的图像创建一致的角色,并确保它们看起来统一。

音频反应舞者进化

使用复杂几何图形制作的音频反应背景来转换你的主题。

CCSR | 一致的图像/视频放大器

CCSR 模型通过更加关注内容一致性来增强图像和视频放大效果。

Pyramid Flow | 视频生成

包括文字转视频和图像转视频模式。

Stable Diffusion 3.5 vs FLUX.1

Stable Diffusion 3.5 vs FLUX.1

在一个ComfyUI工作流程中比较Stable Diffusion 3.5和FLUX.1。

创意软件肥皂

创意软件肥皂

结合 IPAdapter 和 ControlNet 实现高效的纹理应用和增强的视觉效果。

PuLID | 精准的人脸嵌入用于文本到图像生成

PuLID | 精准的人脸嵌入用于文本到图像生成

使用 PuLID 和 IPAdapter Plus 无缝集成面部特征并控制风格。

产品重光视频 | Vid2Vid

输入一个视频和光掩码以生成重光视频

关注我们
  • 领英
  • Facebook
  • Instagram
  • Twitter
支持
  • Discord
  • 电子邮件
  • 系统状态
  • 附属
资源
  • 免费 ComfyUI 在线版
  • ComfyUI 指南
  • RunComfy API
  • ComfyUI 教程
  • ComfyUI 节点
  • 了解更多
法律
  • 服务条款
  • 隐私政策
  • Cookie 政策
RunComfy
版权 2025 RunComfy. 保留所有权利。

RunComfy 是首选的 ComfyUI 平台,提供 ComfyUI 在线 环境和服务,以及 ComfyUI 工作流 具有惊艳的视觉效果。 RunComfy还提供 AI Playground, 帮助艺术家利用最新的AI工具创作出令人惊叹的艺术作品。