ACE-Step 1.5XL Turbo comfyui 工作流 | 快速 AI 文本到音乐

ComfyUI ACE-Step 1.5XL Turbo Workflow

ACE-Step 1.5XL Turbo comfyui workflow | Fast AI Text-to-Music

Want to run this workflow?

Fully operational workflows
No missing nodes or models
No manual setups required
Features stunning visuals

ComfyUI ACE-Step 1.5XL Turbo Examples

ACE-Step 1.5XL Turbo 文本到音乐 ComfyUI 工作流#

使用此专注于速度和可重复性的 comfyui 工作流，将简洁的提示转化为精美的 MP3 音乐。它将 ACE-Step 1.5XL Turbo 生成器与其官方 VAE 和双 Qwen 文本编码器配对，然后直接导出为 MP3，以便于预览和重用。制作人、声音设计师和提示艺术家可以快速迭代，同时保持结果在不同运行间的一致性。

此 comfyui 工作流中的关键模型#

ACE-Step 1.5XL Turbo (bf16)。核心扩散模型，从文本条件中合成音乐，优化用于快速去噪和高质量音频潜在空间。模型文件
ACE-Step 1.5 VAE。将音频潜在空间转换为最终波形的解码器，同时保留 ACE-Step 系列所期望的音色和动态。模型文件
Qwen 0.6B ACE 1.5 文本编码器。轻量编码器，将您的描述性提示转化为生成器使用的条件向量。模型文件
Qwen 4B ACE 1.5 文本编码器。更大的伴随编码器，丰富语义、风格提示、乐器和人声提示，以实现更忠实的渲染。模型文件

如何使用此 comfyui 工作流#

图表分为两个主要组加上全局控制。您加载 ACE-Step 模型堆栈，描述您想要的音乐，设置歌曲时长和种子，然后采样、解码并导出为 MP3。

模型组#

此部分初始化生成器所需的模型堆栈。UNETLoader (#104) 加载 ACE-Step 1.5XL Turbo，VAELoader (#106) 引入匹配的 ACE-Step 1.5 VAE，以确保解码保持忠实。DualCLIPLoader (#105) 将 Qwen 0.6B 和 4B 文本编码器配对以准备提示嵌入。UNet 通过 ModelSamplingAuraFlow (#78) 路由，该配置应用模型在去噪开始前所需的采样器配置。

提示组#

在 TextEncodeAceStepAudio1.5 (#94) 中写下关于流派、情绪、乐器、人声、节奏和制作风格的简明描述。如果您使用歌词或结构笔记，请在次要文本框中提供它们，以便编码器可以条件化措辞和动态。负面条件通过 ConditioningZeroOut (#47) 被故意禁用，以保持输出的专注和简化早期迭代。节点还接受全局 duration 和 seed，确保条件化与轨道长度和您的可重复性设置保持一致。

时长和种子#

使用 Float (Duration) (#99) 设置轨道长度（以秒为单位）。在 Int (Seed) (#109) 中选择一个 seed，以便在编码器和采样器之间进行可重复的运行。保持相同的种子，同时仅更改提示是 A/B 测试创意方向的可靠方法。为了广泛探索，在对提示感到满意后改变种子。

潜在音频设置#

EmptyAceStep1.5LatentAudio (#98) 构建一个与您选择的时长匹配的空音频潜在空间。这充当去噪期间采样器将填充的画布。较长的时长需要更多的计算，因此考虑在缩放之前从较短的时长开始验证提示。工作流将时长全局接线，因此您的潜在和条件化始终保持同步。

去噪和采样#

KSampler (#3) 使用 ACE-Step 1.5XL Turbo 模型和您的提示条件化执行扩散过程。采样器路径通过 ModelSamplingAuraFlow (#78) 运行，以匹配模型期望的调度器设置，实现稳定、快速的收敛。使用相同的种子比较措辞或风格的变化，并且仅在提示调整到位后调整采样器设置。当采样器完成时，您将获得一个准备解码的音频潜在空间。

解码和导出#

VAEDecodeAudio (#18) 使用 ACE-Step 1.5 VAE 将潜在空间转换为波形，以保留预期的音色。SaveAudioMP3 (#107) 用基本文件名和可选版本标签写入 MP3，以便您可以组织录音。MP3 非常适合快速审查和共享，您始终可以重新渲染或重新导出为其他格式。结果会出现在您标准的 ComfyUI 输出位置。

此 comfyui 工作流中的关键节点#

`TextEncodeAceStepAudio1.5` (#94)#

此节点使用配对的 Qwen 编码器将您的音乐描述和可选歌词翻译为生成器的条件化。保持提示在流派、乐器、人声存在、节奏、情绪和混音特征上具体。确保节点的 duration 与全局歌曲长度匹配，以便结构和措辞保持一致。在措辞上迭代时使用固定的 seed，以了解术语如何影响编排和音色。

`EmptyAceStep1.5LatentAudio` (#98)#

控制模型将填充的时间画布。增加时长会增加内存和渲染时间，因此在提交较长作品之前先在较短草稿上迭代。保持时长变化有意，因为即使使用相同的提示和种子，它们也可能改变感知的节奏和段落节奏。

`KSampler` (#3)#

通过控制如何从潜在空间中去除噪声来驱动质量、速度和整体纹理。从提供的调度器路径开始，仅在提示感觉正确后调整采样器设置。对于快速草稿，减少采样努力；对于更高的保真度，逐渐增加，同时保持种子不变，以便轻松听出差异。有关一般指导，请参阅 ComfyUI 仓库中的核心采样器行为。ComfyUI on GitHub

`SaveAudioMP3` (#107)#

处理导出和文件命名，以便您可以编目录音。设置清晰的基本名称和版本标签，以跟踪迭代。如果您计划进行母带处理或进一步编辑，请在您的笔记中保留项目种子和提示，以便在需要时使用备用导出设置重新渲染。

可选附加功能#

将提示写成简短、有序的短语：流派、情绪、关键感受、节奏、乐器、人声类型、制作风格。
保持歌词简洁，并与选定时长对齐，以避免在结尾处出现仓促措辞。
在优化提示时锁定种子，然后改变种子以探索相同简报的替代编排。
从较短的时长开始验证方向，然后在核心声音有效时进行扩展。
负面条件化是设计上禁用的；仅在初步探索后需要严格排除时启用并调整真正的负面提示。

致谢#

此工作流实现并构建在以下作品和资源之上。我们感谢 Comfy.org 为 Audio ACE Step 1.5 XL Turbo 工作流提供的支持，以及 Comfy-Org 为 ACE-Step 1.5XL Turbo 扩散模型、ACE-Step 1.5 VAE、ACE-Step 1.5 文本编码器 0.6B 和 ACE-Step 1.5 文本编码器 4B 的贡献和维护。有关权威详细信息，请参阅下面链接的原始文档和仓库。

资源#

Comfy.org/Audio ACE Step 1.5 XL Turbo 工作流
- 文档 / 发布说明：工作流页面
Comfy-Org/ACE-Step 1.5XL Turbo 扩散模型
- Hugging Face: acestep_v1.5_xl_turbo_bf16.safetensors
Comfy-Org/ACE-Step 1.5 VAE
- Hugging Face: ace_1.5_vae.safetensors
Comfy-Org/ACE-Step 1.5 文本编码器 0.6B
- Hugging Face: qwen_0.6b_ace15.safetensors
Comfy-Org/ACE-Step 1.5 文本编码器 4B
- Hugging Face: qwen_4b_ace15.safetensors

注：使用参考的模型、数据集和代码需遵循其作者和维护者提供的各自许可证和条款。

Want More ComfyUI Workflows?

ACE-Step 音乐生成 | AI 音频创作

利用突破性的扩散技术，生成录音室质量的音乐，速度提高 15 倍。

Ace Step 1.5 | 商业级AI音乐生成器

通过智能规划和扩散能力将文本转化为完整的歌曲。

Stable Audio Open 1.0 | 文本到音乐工具

将文本提示无缝快速地转化为电影音乐。

MMAudio | 视频到音频

MMAudio：用于高质量音频生成的先进视频到音频模型。

Woosh音效生成 | Text2Audio + VideoSync

将提示和视频转换为清晰同步的音频效果。

FLUX.2 Dev LoRA 推理 | AI Toolkit ComfyUI

使用单个 RunComfy RC 自定义节点，在 ComfyUI 中运行您的 AI Toolkit 训练的 FLUX.2 Dev LoRA，具有与训练匹配的行为。

UNO | 一致性主体与对象生成

从主体和对象参考中创建稳定且一致的图像。

Wan 2.2 FLF2V | 首尾帧视频生成

使用 Wan 2.2 FLF2V 从起始和结束帧生成流畅视频。

关注我们

支持

资源

法律

RunComfy

RunComfy 是首选的 ComfyUI 平台，提供 ComfyUI 在线环境和服务，以及 ComfyUI 工作流具有惊艳的视觉效果。 RunComfy还提供 AI Models, 帮助艺术家利用最新的AI工具创作出令人惊叹的艺术作品。

ACE-Step 1.5XL Turbo comfyui 工作流 | 文本到音乐生成器