logo
RunComfy
  • ComfyUI
  • TrainerNew
  • Models
  • API
  • Pricing
discord logo
ComfyUI>工作流>LatentSync| 口型同步模型

LatentSync| 口型同步模型

Workflow Name: RunComfy/LatentSync
Workflow ID: 0000...1182
更新于 2025/6/16:ComfyUI 版本更新至 v0.3.40,以提高稳定性和兼容性。LatentSync 通过音频条件的潜在扩散模型重新定义口型同步,绕过中间运动表示,实现无缝的音频视觉对齐。凭借 Stable Diffusion 的优势,它在确保时间平滑度的同时捕捉复杂的关联。与基于像素的方法不同,LatentSync 通过其创新的时间表示对齐(TREPA)模块确保卓越的时间一致性。TREPA 模块有助于提供无与伦比的精度和逼真度。

LatentSync 是一个最先进的端到端口型同步框架,利用音频条件的潜在扩散模型的力量,生成逼真的口型同步。LatentSync 的独特之处在于其能够直接建模音频和视觉组件之间复杂的关联,而无需依赖任何中间运动表示,革命性地改变了口型同步合成的方法。

LatentSync 流程的核心是 Stable Diffusion 的集成,这是一种强大的生成模型,以其卓越的捕捉和生成高质量图像的能力而著称。通过利用 Stable Diffusion 的能力,LatentSync 能够有效地学习和再现语音音频与相应口部运动之间的复杂动态,产生高度准确和令人信服的口型同步动画。

基于扩散的口型同步方法的一个关键挑战是保持生成帧之间的时间一致性,这对于实现逼真的结果至关重要。LatentSync 通过其突破性的时间表示对齐(TREPA)模块正面解决了这一问题,专门设计用于增强口型同步动画的时间连贯性。TREPA 使用先进技术从生成帧中提取时间表示,利用大规模自监督视频模型。通过将这些表示与真实帧对齐,LatentSync 的框架确保了高度的时间连贯性,产生显著平滑且令人信服的口型同步动画,与音频输入紧密匹配。

1.1 如何使用 LatentSync 工作流程?

LatentSync

这是 LatentSync 的工作流程,左侧节点是上传视频的输入,中间是处理 LatentSync 节点,右侧是输出节点。

  • 在输入节点上传您的视频。
  • 上传您的对话音频输入。
  • 点击渲染!!!

1.2 视频输入

LatentSync
  • 点击并上传包含面部的参考视频。

视频调整为 25 FPS,以便与音频模型正确同步。

1.3 音频输入

LatentSync
  • 点击并在此处上传您的音频。

LatentSync 以其创新的音频视觉生成方法设定了口型同步的新基准。通过结合精确性、时间一致性和 Stable Diffusion 的力量,LatentSync 改变了我们创建同步内容的方式。使用 LatentSync 重新定义口型同步的可能性。

Want More ComfyUI Workflows?

Hallo2 | 唇同步肖像动画

4K肖像动画的音频驱动唇同步。

EchoMimic | 音频驱动的人像动画

生成与提供的音频同步的逼真说话头像和身体动作。

SVD(稳定视频扩散)+ SD | 文本转视频

集成稳定扩散和稳定视频扩散,将文本直接转换为视频。

Animatediff V2 & V3 | 文本转视频

探索 AnimateDiff V3、AnimateDiff SDXL 和 AnimateDiff V2,并使用 Upscale 获得高分辨率结果。

Stable Diffusion 3 (SD3) | 文本到图像

Stable Diffusion 3 (SD3) | 文本到图像

将 Stable Diffusion 3 媒介集成到您的工作流程中,生成卓越的 AI 艺术作品。

姿势控制唇同步 S2V | 富有表现力的视频生成器

通过姿势和音频控制将图像转变为会说话、会动的角色。

Wan 2.2 | 开源视频生成领导者

现已推出!更高精度 + 更流畅的运动。

Qwen Image 2512 LoRA 推断 | AI Toolkit ComfyUI

通过一个 RCQwenImage2512 节点在 ComfyUI 中使用 Qwen Image 2512 的 AI Toolkit 训练的 LoRA 进行预览对齐的生成。

关注我们
  • 领英
  • Facebook
  • Instagram
  • Twitter
支持
  • Discord
  • 电子邮件
  • 系统状态
  • 附属
资源
  • 免费 ComfyUI 在线版
  • ComfyUI 指南
  • RunComfy API
  • ComfyUI 教程
  • ComfyUI 节点
  • 了解更多
法律
  • 服务条款
  • 隐私政策
  • Cookie 政策
RunComfy
版权 2026 RunComfy. 保留所有权利。

RunComfy 是首选的 ComfyUI 平台,提供 ComfyUI 在线 环境和服务,以及 ComfyUI 工作流 具有惊艳的视觉效果。 RunComfy还提供 AI Models, 帮助艺术家利用最新的AI工具创作出令人惊叹的艺术作品。