SeedVR2 V2.5 是一种高保真视频和图像升频器,能够恢复细节、锐化纹理并提高时间一致性,同时保持运动流畅。此 ComfyUI 工作流程包装了 SeedVR2 扩散变压器及其 VAE,因此您可以将 AI 生成的片段、档案素材或后期处理渲染升频为更清晰、更具电影感的结果。
专为艺术家和编辑设计,SeedVR2 V2.5 工作流程处理单张图像和完整视频,包括 RGBA 内容,并在重新组装升频视频时保留原始音频和帧速率。它包括可选的编译时加速和模型选择,以平衡质量、VRAM 和速度。
SeedVR2 Diffusion Transformer 3B 和 7B。核心一步恢复模型,提升分辨率和感知质量,同时保持时间一致性。使用 3B 适用于较低的 VRAM 或更快的周转速度,使用 7B 时可获得最高保真度。有关详细信息,请参阅官方模型卡和论文:ByteDance-Seed/SeedVR2-3B,ByteDance-Seed/SeedVR2-7B,以及关于一步视频恢复的 SeedVR2 论文 arXiv:2506.05301。
SeedVR2 VAE (ema_vae_fp16)。用于将帧编码为潜在空间并将恢复的结果解码回 RGB 的变分自编码器,支持大分辨率的平铺。与 ComfyUI 集成分发:numz/SeedVR2_comfyUI。
可选量化变体。社区集成提供 FP8 和 GGUF 选项,以在一定质量或速度权衡下减少内存。有关当前选项,请参阅 ComfyUI SeedVR2 节点存储库:ComfyUI-SeedVR2_VideoUpscaler。
此图有两个独立的组,使用相同的模型加载器和升频逻辑。使用图像组处理单张静态图像。使用视频组将视频拆分为帧和音频,使用 SeedVR2 V2.5 升频帧,然后重新组装带有原始音频和帧速率的视频片段。
使用 LoadImage (#27) 加载静态图像。如果您的图像具有透明度,请通过 JoinImageWithAlpha (#31) 路由,以便在升频过程中保留 alpha 通道。选择并加载 DiT 检查点与 SeedVR2LoadDiTModel (#28) 和 VAE 与 SeedVR2LoadVAEModel (#29); 模型将在首次使用时自动下载。将图像输入到 SeedVR2VideoUpscaler (#30) 进行升频和恢复;节点专注于细节恢复和控制锐化,以匹配 SeedVR2 V2.5 的外观。使用 SaveImage (#32) 保存结果。对于批处理运行,您可以启用 SeedVR2TorchCompileSettings (#25) 来编译图一次并加速后续批次。
使用 LoadVideo (#21) 导入剪辑,然后 GetVideoComponents (#22) 提取帧、音频和帧速率。如果您的帧包含 alpha,请在升频前通过 JoinImageWithAlpha (#17) 合并它。使用 SeedVR2LoadDiTModel (#14) 和 SeedVR2LoadVAEModel (#13) 加载您选择的 DiT 和 VAE,然后使用 SeedVR2VideoUpscaler (#10) 升频帧流。使用 CreateVideo (#24) 重建视频,传递原始音频和帧速率,并使用 SaveVideo (#23) 写入文件。对于长剪辑,SeedVR2TorchCompileSettings (#19) 在初始编译步骤后减少每次迭代时间。
SeedVR2VideoUpscaler (#10 和 #30)
由 SeedVR2 驱动的中央恢复和升频节点。通过比例或目标尺寸设置您的目标升频目标,并选择适合您 GPU 的批次大小。时间一致性通过同时处理多个相邻帧来驱动;官方指导指出至少 5 帧的批次会激活视频的时间一致性,如果 VRAM 允许,较大的批次会提高稳定性 ComfyUI-SeedVR2_VideoUpscaler。对于 RGBA,确保 alpha 路径在上游连接。如果在高分辨率下看到内存压力,请降低目标分辨率或切换到较轻的模型变体。
SeedVR2LoadDiTModel (#14 和 #28)
加载 SeedVR2 变压器检查点并配置推理设备。根据您的质量和 VRAM 预算选择 3B 和 7B;FP16 提供最佳保真度,而 FP8 或 GGUF 可以在受限的 GPU 上提供帮助,由社区集成公开 numz/SeedVR2_comfyUI 和官方 ComfyUI 节点仓库 ComfyUI-SeedVR2_VideoUpscaler。保持 DiT 在您最快的 GPU 上,除非您明确卸载以节省内存。
SeedVR2LoadVAEModel (#13 和 #29)
加载用于编码和解码的 EMA VAE。针对大输出时,启用平铺编码或解码以在速度上付出小代价来减少峰值 VRAM;仅在遇到 OOM 或边缘伪影时调整平铺大小和重叠。将 VAE 卸载到 CPU 或其他 GPU 可以为 DiT 腾出空间而不改变结果 numz/SeedVR2_comfyUI。
SeedVR2TorchCompileSettings (#19 和 #25)
可选加速,通过将 SeedVR2 路径的部分编译成融合内核计划来加速。第一次运行支付编译成本,然后后续批次更快,这对于较长的视频或重复迭代是理想的 ComfyUI-SeedVR2_VideoUpscaler。
audio 和 fps 输出从 GetVideoComponents (#22) 连接到 CreateVideo (#24) 来保留音频和时间。JoinImageWithAlpha 合并 alpha,以在合成中保持边缘清晰。此工作流程实现并构建在以下作品和资源的基础上。我们感谢 numz 对 ComfyUI-SeedVR2_VideoUpscaler (SeedVR2 v2.5 节点/工作流程) 的贡献和维护,以及 AInVFX 对官方 SeedVR2 v2.5 视频教程的贡献。有关权威详细信息,请参阅下文链接的原始文档和存储库。
注意:使用引用的模型、数据集和代码需遵循其作者和维护者提供的各自许可和条款。
RunComfy 是首选的 ComfyUI 平台,提供 ComfyUI 在线 环境和服务,以及 ComfyUI 工作流 具有惊艳的视觉效果。 RunComfy还提供 AI Playground, 帮助艺术家利用最新的AI工具创作出令人惊叹的艺术作品。