logo
RunComfy
  • Models
  • ComfyUI
  • TrainerNew
  • API
  • Pricing
discord logo
ComfyUI>工作流>MMAudio | 视频到音频

MMAudio | 视频到音频

Workflow Name: RunComfy/MMAudio
Workflow ID: 0000...1180
MMAudio 以无与伦比的精度从视频和文本输入中生成同步音频。通过多模态联合训练,它无缝适应多样化的视听和音频文本数据集。其先进的同步模块确保完美对齐,改变现代内容需求的音频创作。

ComfyUI-MMAudio 节点及其相关工作流程完全由 Kijai 开发。我们对 Kijai 的这项创新工作给予充分的肯定。在 RunComfy 平台上,我们只是向社区展示 Kijai 的贡献。需要注意的是,目前 RunComfy 和 Kijai 之间没有正式的联系或合作。我们深表感谢 Kijai 的工作!

MMAudio

MMAudio 是一个强大的工具,可以从视频和文本输入中创建同步音频。它利用多模态联合训练从多样化的视听和音频文本数据集中学习,确保出色的适应性。凭借其先进的同步模块,它将音频完美对齐到视频帧。MMAudio 革新了音频生成,为创作者和创新者简化了流程。

1.1 如何使用 MMAudio 工作流程?

MMAudio

这是 MMAudio 工作流程,左侧节点是用于上传视频的输入,中间是处理 MMAudio 节点,右侧是输出节点。

  • 在输入节点上传您的视频。
  • 编写您的音频生成提示。
  • 点击渲染!!!

1.2 视频输入

MMAudio
  • 点击并上传您的参考视频。

视频设置为缩小到 ?*512 分辨率,因为处理高清或较长的视频可能会耗尽内存。

1.3 MMAudio 处理

MMAudio
  • Positive:输入音频的视频生成提示。
  • Negative:输入您不想听到的内容。
  • Steps:更多步骤可能会提高音频质量。

1.4 MMAudio 模型

MMAudio

这些是模型下载器节点,它将在您的 comfyui 中自动下载模型,需时 2-3 分钟。

  • MMAudio 模型:https://github.com/hkchengrex/MMAudio

凭借其创新的多模态训练和精确的同步,MMAudio 在音频生成中树立了新的标准。无论您是在制作视频、动画还是沉浸式体验,MMAudio 都可以为创作者提供无缝、高质量的音频。提升您的项目并用 MMAudio 将您的想法变为现实。

Want More ComfyUI Workflows?

VACE Wan2.1 | V2V

使用VACE Wan2.1,通过参考风格图像转换视频。

混元视频 | 视频到视频

结合文本提示和源视频生成新视频。

音频反应遮罩扩展 | 惊艳动画

变换您的主题,赋予他们脉动的、由音乐驱动的光环,随节奏起舞。

UNO | 一致性主体与对象生成

从主体和对象参考中创建稳定且一致的图像。

IC-Light | 图像重光照

IC-Light | 图像重光照

轻松编辑背景、增强光照并重新生成新场景。

SVD(稳定视频扩散)+ SD | 文本转视频

集成稳定扩散和稳定视频扩散,将文本直接转换为视频。

Reallusion AI 渲染 | 3D 到 ComfyUI 工作流程集合

ComfyUI + Reallusion = 快速、易用且方便的 3D 视觉效果

Flux Depth 和 Canny

官方 Flux 工具 - Flux Depth 和 Canny 控制网络模型

关注我们
  • 领英
  • Facebook
  • Instagram
  • Twitter
支持
  • Discord
  • 电子邮件
  • 系统状态
  • 附属
资源
  • 免费 ComfyUI 在线版
  • ComfyUI 指南
  • RunComfy API
  • ComfyUI 教程
  • ComfyUI 节点
  • 了解更多
法律
  • 服务条款
  • 隐私政策
  • Cookie 政策
RunComfy
版权 2025 RunComfy. 保留所有权利。

RunComfy 是首选的 ComfyUI 平台,提供 ComfyUI 在线 环境和服务,以及 ComfyUI 工作流 具有惊艳的视觉效果。 RunComfy还提供 AI Models, 帮助艺术家利用最新的AI工具创作出令人惊叹的艺术作品。