logo
RunComfy
  • ComfyUI
  • TrainerNew
  • Models
  • API
  • Pricing
discord logo
ComfyUI>工作流>ACE-Step 1.5XL Turbo comfyui 工作流 | 文本到音乐生成器

ACE-Step 1.5XL Turbo comfyui 工作流 | 文本到音乐生成器

Workflow Name: RunComfy/ACE-Step-1.5XL-Turbo
Workflow ID: 0000...1395
使用 ACE-Step 1.5XL Turbo AI 工作流从任何文本输入中即时创建音乐。该设置集成了优化的 ACE 模型堆栈与 Qwen 文本编码器,以生成清晰详细的 MP3 输出。它使设计师和音频创作者能够快速测试创意提示、优化音乐音调并保存结果以供重用。通过其精简的流程,大幅缩短生成时间,同时保持保真度。非常适合快速概念试验和 AI 音乐原型设计。

ACE-Step 1.5XL Turbo 文本到音乐 ComfyUI 工作流

使用此专注于速度和可重复性的 comfyui 工作流,将简洁的提示转化为精美的 MP3 音乐。它将 ACE-Step 1.5XL Turbo 生成器与其官方 VAE 和双 Qwen 文本编码器配对,然后直接导出为 MP3,以便于预览和重用。制作人、声音设计师和提示艺术家可以快速迭代,同时保持结果在不同运行间的一致性。

此 comfyui 工作流中的关键模型

  • ACE-Step 1.5XL Turbo (bf16)。核心扩散模型,从文本条件中合成音乐,优化用于快速去噪和高质量音频潜在空间。模型文件
  • ACE-Step 1.5 VAE。将音频潜在空间转换为最终波形的解码器,同时保留 ACE-Step 系列所期望的音色和动态。模型文件
  • Qwen 0.6B ACE 1.5 文本编码器。轻量编码器,将您的描述性提示转化为生成器使用的条件向量。模型文件
  • Qwen 4B ACE 1.5 文本编码器。更大的伴随编码器,丰富语义、风格提示、乐器和人声提示,以实现更忠实的渲染。模型文件

如何使用此 comfyui 工作流

图表分为两个主要组加上全局控制。您加载 ACE-Step 模型堆栈,描述您想要的音乐,设置歌曲时长和种子,然后采样、解码并导出为 MP3。

模型组

此部分初始化生成器所需的模型堆栈。UNETLoader (#104) 加载 ACE-Step 1.5XL Turbo,VAELoader (#106) 引入匹配的 ACE-Step 1.5 VAE,以确保解码保持忠实。DualCLIPLoader (#105) 将 Qwen 0.6B 和 4B 文本编码器配对以准备提示嵌入。UNet 通过 ModelSamplingAuraFlow (#78) 路由,该配置应用模型在去噪开始前所需的采样器配置。

提示组

在 TextEncodeAceStepAudio1.5 (#94) 中写下关于流派、情绪、乐器、人声、节奏和制作风格的简明描述。如果您使用歌词或结构笔记,请在次要文本框中提供它们,以便编码器可以条件化措辞和动态。负面条件通过 ConditioningZeroOut (#47) 被故意禁用,以保持输出的专注和简化早期迭代。节点还接受全局 duration 和 seed,确保条件化与轨道长度和您的可重复性设置保持一致。

时长和种子

使用 Float (Duration) (#99) 设置轨道长度(以秒为单位)。在 Int (Seed) (#109) 中选择一个 seed,以便在编码器和采样器之间进行可重复的运行。保持相同的种子,同时仅更改提示是 A/B 测试创意方向的可靠方法。为了广泛探索,在对提示感到满意后改变种子。

潜在音频设置

EmptyAceStep1.5LatentAudio (#98) 构建一个与您选择的时长匹配的空音频潜在空间。这充当去噪期间采样器将填充的画布。较长的时长需要更多的计算,因此考虑在缩放之前从较短的时长开始验证提示。工作流将时长全局接线,因此您的潜在和条件化始终保持同步。

去噪和采样

KSampler (#3) 使用 ACE-Step 1.5XL Turbo 模型和您的提示条件化执行扩散过程。采样器路径通过 ModelSamplingAuraFlow (#78) 运行,以匹配模型期望的调度器设置,实现稳定、快速的收敛。使用相同的种子比较措辞或风格的变化,并且仅在提示调整到位后调整采样器设置。当采样器完成时,您将获得一个准备解码的音频潜在空间。

解码和导出

VAEDecodeAudio (#18) 使用 ACE-Step 1.5 VAE 将潜在空间转换为波形,以保留预期的音色。SaveAudioMP3 (#107) 用基本文件名和可选版本标签写入 MP3,以便您可以组织录音。MP3 非常适合快速审查和共享,您始终可以重新渲染或重新导出为其他格式。结果会出现在您标准的 ComfyUI 输出位置。

此 comfyui 工作流中的关键节点

TextEncodeAceStepAudio1.5 (#94)

此节点使用配对的 Qwen 编码器将您的音乐描述和可选歌词翻译为生成器的条件化。保持提示在流派、乐器、人声存在、节奏、情绪和混音特征上具体。确保节点的 duration 与全局歌曲长度匹配,以便结构和措辞保持一致。在措辞上迭代时使用固定的 seed,以了解术语如何影响编排和音色。

EmptyAceStep1.5LatentAudio (#98)

控制模型将填充的时间画布。增加时长会增加内存和渲染时间,因此在提交较长作品之前先在较短草稿上迭代。保持时长变化有意,因为即使使用相同的提示和种子,它们也可能改变感知的节奏和段落节奏。

KSampler (#3)

通过控制如何从潜在空间中去除噪声来驱动质量、速度和整体纹理。从提供的调度器路径开始,仅在提示感觉正确后调整采样器设置。对于快速草稿,减少采样努力;对于更高的保真度,逐渐增加,同时保持种子不变,以便轻松听出差异。有关一般指导,请参阅 ComfyUI 仓库中的核心采样器行为。ComfyUI on GitHub

SaveAudioMP3 (#107)

处理导出和文件命名,以便您可以编目录音。设置清晰的基本名称和版本标签,以跟踪迭代。如果您计划进行母带处理或进一步编辑,请在您的笔记中保留项目种子和提示,以便在需要时使用备用导出设置重新渲染。

可选附加功能

  • 将提示写成简短、有序的短语:流派、情绪、关键感受、节奏、乐器、人声类型、制作风格。
  • 保持歌词简洁,并与选定时长对齐,以避免在结尾处出现仓促措辞。
  • 在优化提示时锁定种子,然后改变种子以探索相同简报的替代编排。
  • 从较短的时长开始验证方向,然后在核心声音有效时进行扩展。
  • 负面条件化是设计上禁用的;仅在初步探索后需要严格排除时启用并调整真正的负面提示。

致谢

此工作流实现并构建在以下作品和资源之上。我们感谢 Comfy.org 为 Audio ACE Step 1.5 XL Turbo 工作流提供的支持,以及 Comfy-Org 为 ACE-Step 1.5XL Turbo 扩散模型、ACE-Step 1.5 VAE、ACE-Step 1.5 文本编码器 0.6B 和 ACE-Step 1.5 文本编码器 4B 的贡献和维护。有关权威详细信息,请参阅下面链接的原始文档和仓库。

资源

  • Comfy.org/Audio ACE Step 1.5 XL Turbo 工作流
    • 文档 / 发布说明:工作流页面
  • Comfy-Org/ACE-Step 1.5XL Turbo 扩散模型
    • Hugging Face: acestep_v1.5_xl_turbo_bf16.safetensors
  • Comfy-Org/ACE-Step 1.5 VAE
    • Hugging Face: ace_1.5_vae.safetensors
  • Comfy-Org/ACE-Step 1.5 文本编码器 0.6B
    • Hugging Face: qwen_0.6b_ace15.safetensors
  • Comfy-Org/ACE-Step 1.5 文本编码器 4B
    • Hugging Face: qwen_4b_ace15.safetensors

注:使用参考的模型、数据集和代码需遵循其作者和维护者提供的各自许可证和条款。

Want More ComfyUI Workflows?

ACE-Step 音乐生成 | AI 音频创作

利用突破性的扩散技术,生成录音室质量的音乐,速度提高 15 倍。

Ace Step 1.5 | 商业级AI音乐生成器

通过智能规划和扩散能力将文本转化为完整的歌曲。

Stable Audio Open 1.0 | 文本到音乐工具

将文本提示无缝快速地转化为电影音乐。

MMAudio | 视频到音频

MMAudio:用于高质量音频生成的先进视频到音频模型。

Woosh音效生成 | Text2Audio + VideoSync

将提示和视频转换为清晰同步的音频效果。

一致性角色创建器 3.8 | 超写实一致性 AI 角色

从一张参考图像创建超写实、身份一致的 AI 角色。

FireRed 图像编辑 | 智能照片增强器

锐利的照片修复,忠实的色调和完美的细节控制。

Wan 2.1 Fun | ControlNet 视频生成

使用 ControlNet 风格的视觉通道,如深度、Canny 和 OpenPose 生成视频。

关注我们
  • 领英
  • Facebook
  • Instagram
  • Twitter
支持
  • Discord
  • 电子邮件
  • 系统状态
  • 附属
资源
  • 免费 ComfyUI 在线版
  • ComfyUI 指南
  • RunComfy API
  • ComfyUI 教程
  • ComfyUI 节点
  • 了解更多
法律
  • 服务条款
  • 隐私政策
  • Cookie 政策
RunComfy
版权 2026 RunComfy. 保留所有权利。

RunComfy 是首选的 ComfyUI 平台,提供 ComfyUI 在线 环境和服务,以及 ComfyUI 工作流 具有惊艳的视觉效果。 RunComfy还提供 AI Models, 帮助艺术家利用最新的AI工具创作出令人惊叹的艺术作品。