Модель генерации музыки ACE-Step в ComfyUI | Создание аудио с помощью ИИ

1. Что такое рабочий процесс ComfyUI ACE-Step?

ComfyUI ACE-Step интегрирует недавно разработанную базовую модель генерации музыки ACE-Step в среду ComfyUI. Построенная на гибридной архитектуре, объединяющей генерацию на основе диффузии с Deep Compression AutoEncoder (DCAE) от Sana и легким линейным трансформером, ACE-Step позволяет сверхбыструю генерацию музыки высокого качества с исключительными возможностями управления. Этот рабочий процесс позволяет пользователям создавать оригинальную музыку в самых разных жанрах и стилях с простыми подсказками на естественном языке и текстами.

2. Преимущества ComfyUI ACE-Step:

Беспрецедентная скорость: Синтезирует до 4 минут музыки всего за 20 секунд — в 15 раз быстрее, чем альтернативы на основе LLM
Музыкальная связность: ACE-Step поддерживает превосходное качество по всем измерениям мелодии, гармонии и ритма
Многоязычная поддержка: Генерирует музыку на 19 разных языках с исключительной производительностью на 10 лучших языках
Расширенное управление: Позволяет клонирование голоса, редактирование текстов, ремикширование и генерацию треков с тонкими параметрами
Творческая гибкость: Поддерживает разнообразные музыкальные стили, жанры и инструменты с различными форматами описания
Бесшовная интеграция: Напрямую подключается к рабочим процессам ComfyUI для создания аудио с помощью ИИ

3. Как использовать рабочий процесс ComfyUI ACE-Step

3.1 Методы генерации с ComfyUI ACE-Step

Пример настройки для ACE-Step:

Подготовьте входные данные: В узле TextEncodeAceStepAudio:
- Добавьте описательные теги для музыкального стиля (например, "country rock, folk rock, southern rock, bluegrass, pop")
- Введите тексты с тегами структуры, такими как [verse], [chorus], [bridge]
- Настройте lyrics_strength (1.00 по умолчанию)
Настройте параметры узла KSampler:
- Настройте шаги (50 рекомендуется для ACE-Step)
- Установите cfg (4.0 по умолчанию)
- Установите значение denoise (1.00 по умолчанию)
В узле EmptyAceStepLatentAudio:
- Установите желаемую продолжительность в секундах (30.0 по умолчанию)
- Установите batch_size
Нажмите кнопку Run, чтобы запустить рабочий процесс ACE-Step
В узле SaveAudio: прослушайте или сохраните сгенерированную музыку

Основной рабочий процесс генерации ACE-Step

Лучше всего подходит для: Создания оригинальной музыки из текстовых описаний и текстов
Характеристики:
- Быстрая генерация (в 15 раз быстрее, чем альтернативы на основе LLM)
- Сильная музыкальная связность и качество
- Гибкое управление продолжительностью

Специализированные рабочие процессы ACE-Step (на основе LoRA)

Lyric2Vocal: Модель ACE-Step, адаптированная для генерации высококачественных вокалов из текстов
Text2Samples: Специализированный вариант ACE-Step для создания инструментальных лупов и семплов
RapMachine: Оптимизированная модель ACE-Step для генерации рэпа в различных стилях

3.2 Справочник параметров для ComfyUI ACE-Step

Узел TextEncodeAceStepAudio: Этот узел обрабатывает текстовые входные данные для управления генерацией музыки ACE-Step.

clip: Текстовое поле для описаний стиля, жанров и настроения
lyrics: Текстовое поле для текстов песен с необязательными тегами структуры
lyrics_strength: Управляет тем, насколько сильно тексты влияют на генерацию (по умолчанию: 1.00)

Узел KSampler: Управляет процессом диффузионного семплирования в ACE-Step.

seed: Устанавливает начальное значение для рандомизации результатов
control_after_generate: Опции для поведения seed после генерации
steps: Количество шагов диффузии (чем больше, тем больше уточнений)
cfg: Масштаб классификатора (чем больше, тем больше следования подсказке)
sampler_name: Алгоритм, используемый для семплирования (рекомендуется res_multistep)
scheduler: Тип расписания шума (рекомендуется simple)
denoise: Управляет уровнем удаления шума (1.00 — полное удаление шума)

Узел EmptyAceStepLatentAudio: Инициализирует пространство генерации аудио.

seconds: Продолжительность генерируемого аудио в секундах
batch_size: Количество семплов для одновременной генерации

Узел VAEDecodeAudio: Декодирует латентные представления в слышимый формат.

samples: Входные данные от KSampler
vae: Модель VAE, используемая для декодирования

Узел SaveAudio: Выводит итоговый аудиорезультат ACE-Step.

filename_prefix: Префикс для сохраняемых аудиофайлов
audio: Плеер для предварительного прослушивания сгенерированного аудио

3.3. Продвинутые техники с ComfyUI ACE-Step

Генерация вариаций:

Настройте параметр variance для управления сходством с оригинальными генерациями ACE-Step
Более высокая variance создает более разносторонние выходы, сохраняя основные музыкальные элементы

Перерисовка:

Избирательно регенерируйте специфические участки аудио, сохраняя остальное
Полезно для исправления проблемных сегментов без изменения всей композиции

Редактирование текстов в ACE-Step:

Изменяйте тексты, сохраняя мелодию, тембр голоса и аккомпанемент
Поддерживает редактирование на нескольких языках, сохраняя музыкальную структуру

Клонирование голоса:

Сохраняет вокальные характеристики при генерации нового контента с ACE-Step
Может быть объединено с редактированием текстов для гибких вокальных выступлений

Перенос стиля:

Применяйте новые музыкальные стили к существующим композициям
Сохраняет основную музыкальную структуру при принятии характеристик разных жанров

3.4. Подсказки для ACE-Step:

Для общей музыки:

Будьте конкретны о жанре, настроении и инструментовке в подсказках для ACE-Step
Примеры подсказок: "electronic, rock, pop" или "funk, pop, soul, melodic"
Более подробные подсказки: "dark, death rock, metal, hardcore, electric guitar, powerful, bass, drums, 110 bpm, G major"

Для инструментальной музыки:

Уточняйте инструменты и музыкальные характеристики
Примеры подсказок: "saxophone, jazz" или "violin, solo, fast tempo"
Более подробные подсказки: "sonata, piano, Violin, B Flat Major, allegro"

Для многоязычной поддержки:

ACE-Step работает лучше всего с: English, Chinese, Russian, Spanish, Japanese, German, French, Portuguese, Italian, Korean
Языки с нелатинскими скриптами, такие как китайский, японский и корейский, хорошо поддерживаются

Дополнительная информация об ACE-Step

Для дополнительных сведений и справок по разработке:

Оригинальная модель ACE-Step от ACE Studio and StepFun
Разработчики модели: Junmin Gong, Sean Zhao, Sen Wang, Shengyuan Xu, и Joe Guo

Благодарности

Этот рабочий процесс поддерживается ACE-Step, совместно разработанным ACE Studio и StepFun. Интеграция ComfyUI ACE-Step позволяет бесшовную генерацию музыки в среде ComfyUI. Полная заслуга принадлежит оригинальным авторам за их новаторскую работу над ACE-Step.

Want More ComfyUI Workflows?

MMAudio | Видео-в-Аудио

MMAudio: Продвинутая модель видео-в-аудио для высококачественной генерации аудио.

Sonic | Анимация портретов с синхронизацией речи

Sonic предоставляет продвинутую анимацию портретов с синхронизацией речи на основе аудио высокого качества.

LatentSync| Модель синхронизации губ

Продвинутая технология синхронизации губ, управляемая аудио.

UNO | Генерация последовательных объектов и субъектов

Создавайте стабильные и последовательные изображения из ссылок на объекты и субъекты.

Blender + ComfyUI | AI рендеринг 3D анимаций

Используйте Blender для настройки 3D сцен и создания последовательностей изображений, затем используйте ComfyUI для AI рендеринга.

Hunyuan Image 2.1 | Генератор высококачественных AI изображений

Модель следующего поколения 2.1 для четких, резких, ультра-чистых AI визуалов быстро.

Stable Diffusion 3.5

Stable Diffusion 3.5 (SD3.5) для высококачественного и разнообразного генерирования изображений.

IC-Light | Перезаписка видео | AnimateDiff

Перезаписывайте ваши видео с картами освещения и подсказками

Подписывайтесь на нас

Поддержка

Ресурсы

Юридическая информация

RunComfy

RunComfy - ведущая ComfyUI платформа, предлагающая ComfyUI онлайн среду и услуги, а также рабочие процессы ComfyUI с потрясающей визуализацией. RunComfy также предоставляет AI Models, позволяя художникам использовать новейшие инструменты AI для создания невероятного искусства.

Генерация музыки ACE-Step | Создание аудио с помощью ИИ