Modello di Generazione Musicale ACE-Step in ComfyUI

Questo workflow è basato su ACE-Step, co-sviluppato da ACE Studio e StepFun. Modello originale creato da Junmin Gong, Sean Zhao, Sen Wang, Shengyuan Xu, e Joe Guo.

ComfyUI ACE-Step Flusso di lavoro

ACE-Step Music Generation Model in ComfyUI | AI Audio Creation

Vuoi eseguire questo workflow?

Workflow completamente operativi
Nessun nodo o modello mancante
Nessuna configurazione manuale richiesta
Presenta visuali mozzafiato

ComfyUI ACE-Step Esempi

1. Cos'è il Workflow ComfyUI ACE-Step?#

ComfyUI ACE-Step integra il modello di base per la generazione musicale ACE-Step recentemente sviluppato nell'ambiente ComfyUI. Basato su un'architettura ibrida che combina generazione basata sulla diffusione con il Deep Compression AutoEncoder (DCAE) di Sana e un trasformatore lineare leggero, ACE-Step consente una generazione musicale ultra-rapida e di alta qualità con eccezionali capacità di controllo. Questo workflow permette agli utenti di creare musica originale attraverso generi e stili diversi con semplici prompt in linguaggio naturale e testi.

2. Vantaggi di ComfyUI ACE-Step:#

Velocità Senza Precedenti: Sintetizza fino a 4 minuti di musica in soli 20 secondi—15× più veloce delle alternative basate su LLM
Coerenza Musicale: ACE-Step mantiene una qualità superiore nelle dimensioni di melodia, armonia e ritmo
Supporto Multilingue: Genera musica in 19 lingue diverse con prestazioni eccezionali nelle prime 10 lingue
Controllo Avanzato: Abilita la clonazione vocale, modifica dei testi, remix e generazione di tracce con parametri dettagliati
Flessibilità Creativa: Supporta diversi stili musicali, generi e strumenti con vari formati di descrizione
Integrazione Senza Soluzione di Continuità: Si collega direttamente ai workflow ComfyUI per la creazione audio potenziata dall'AI

3. Come Usare il Workflow ComfyUI ACE-Step#

3.1 Metodi di Generazione con ComfyUI ACE-Step#

Esempio di Configurazione per ACE-Step:

Prepara gli input: Nel nodo TextEncodeAceStepAudio:
- Aggiungi tag descrittivi per lo stile musicale (es. "country rock, folk rock, southern rock, bluegrass, pop")
- Inserisci testi con tag di struttura come [verse], [chorus], [bridge]
- Regola lyrics_strength (1.00 è il predefinito)
Configura i parametri del nodo KSampler:
- Regola i passaggi (50 raccomandati per ACE-Step)
- Imposta cfg (4.0 è il predefinito)
- Imposta il valore di denoise (1.00 è il predefinito)
Nel nodo EmptyAceStepLatentAudio:
- Imposta la durata desiderata in secondi (30.0 è il predefinito)
- Imposta batch_size
Clicca il pulsante Run per eseguire il workflow ACE-Step
Nel nodo SaveAudio: ascolta o salva la tua musica generata

Workflow Principale di Generazione ACE-Step#

Ideale per: Creare musica originale da descrizioni testuali e testi
Caratteristiche:
- Generazione veloce (15× più veloce delle alternative LLM)
- Forte coerenza e qualità musicale
- Controllo flessibile della durata

Workflows Specializzati ACE-Step (basati su LoRA)#

Lyric2Vocal: Modello ACE-Step perfezionato per generare voci di alta qualità dai testi
Text2Samples: Variante specializzata ACE-Step per produrre loop e campioni strumentali
RapMachine: Modello ACE-Step ottimizzato per la generazione rap con vari stili

3.2 Riferimento Parametri per ComfyUI ACE-Step#

Nodo TextEncodeAceStepAudio: Questo nodo elabora gli input testuali per guidare la generazione musicale ACE-Step.

clip: Campo di testo per descrizioni di stile, generi e mood
lyrics: Campo di testo per i testi delle canzoni con tag di struttura opzionali
lyrics_strength: Controlla quanto fortemente i testi influenzano la generazione (predefinito: 1.00)

Nodo KSampler: Controlla il processo di campionamento della diffusione in ACE-Step.

seed: Imposta il seme di randomizzazione per risultati riproducibili
control_after_generate: Opzioni per il comportamento del seme dopo la generazione
steps: Numero di passaggi di diffusione (più alto = più raffinamento)
cfg: Scala di guida senza classificatore (più alto = più aderenza al prompt)
sampler_name: Algoritmo utilizzato per il campionamento (res_multistep raccomandato)
scheduler: Tipo di pianificazione del rumore (semplice raccomandato)
denoise: Controlla il livello di rimozione del rumore (1.00 è il denoising completo)

Nodo EmptyAceStepLatentAudio: Inizializza lo spazio di generazione audio.

seconds: Durata dell'audio generato in secondi
batch_size: Numero di campioni da generare simultaneamente

Nodo VAEDecodeAudio: Decodifica le rappresentazioni latenti in formato udibile.

samples: Input da KSampler
vae: Modello VAE utilizzato per la decodifica

Nodo SaveAudio: Produce il risultato audio finale di ACE-Step.

filename_prefix: Prefisso per i file audio salvati
audio: Player per l'anteprima dell'audio generato

3.3. Tecniche Avanzate con ComfyUI ACE-Step#

Generazione di Variazioni:

Regola il parametro di varianza per controllare la somiglianza con le generazioni originali di ACE-Step
Maggiore varianza crea output più divergenti mantenendo gli elementi musicali core

Repainting:

Rigenera selettivamente sezioni specifiche dell'audio mantenendo il resto
Utile per correggere segmenti problematici senza cambiare l'intera composizione

Modifica Testi in ACE-Step:

Modifica i testi mantenendo melodia, timbro vocale e accompagnamento
Supporta la modifica in più lingue mantenendo la struttura musicale

Clonazione Vocale:

Preserva le caratteristiche vocali generando nuovo contenuto con ACE-Step
Può essere combinato con la modifica dei testi per performance vocali flessibili

Trasferimento di Stile:

Applica nuovi stili musicali a composizioni esistenti
Mantiene la struttura musicale core adottando caratteristiche di genere diverse

3.4. Suggerimenti per i Prompt ACE-Step:#

Per Musica Generale:

Sii specifico su genere, mood e strumentazione nei prompt ACE-Step
Esempi di prompt: "electronic, rock, pop" o "funk, pop, soul, melodic"
Prompt più dettagliati: "dark, death rock, metal, hardcore, electric guitar, powerful, bass, drums, 110 bpm, G major"

Per Musica Strumentale:

Specifica strumenti e caratteristiche musicali
Esempi di prompt: "saxophone, jazz" o "violin, solo, fast tempo"
Prompt più dettagliati: "sonata, piano, Violin, B Flat Major, allegro"

Per Supporto Multilingue:

ACE-Step funziona meglio con: English, Chinese, Russian, Spanish, Japanese, German, French, Portuguese, Italian, Korean
Le lingue con scrittura non latina come Chinese, Japanese, e Korean sono ben supportate

Maggiori Informazioni su ACE-Step#

Per ulteriori dettagli e riferimenti sullo sviluppo:

Modello originale ACE-Step di ACE Studio e StepFun
Sviluppatori del modello: Junmin Gong, Sean Zhao, Sen Wang, Shengyuan Xu, e Joe Guo

Riconoscimenti#

Questo workflow è alimentato da ACE-Step, co-sviluppato da ACE Studio e StepFun. L'integrazione ComfyUI ACE-Step consente una generazione musicale senza soluzione di continuità all'interno dell'ambiente ComfyUI. Tutto il merito va agli autori originali per il loro lavoro rivoluzionario su ACE-Step.

Want More ComfyUI Workflows?

MMAudio | Da Video a Audio

MMAudio: Modello avanzato da video a audio per la generazione di audio di alta qualità.

Sonic | Animazione Lip-Sync per Ritratti

Sonic offre un lip-sync avanzato guidato dall'audio per ritratti con animazioni di alta qualità.

LatentSync| Modello di Lip Sync

Tecnologia avanzata di lip sync guidata dall'audio.

Inserisci Qualsiasi Cosa | Editing di Immagini Basato su Riferimento

Inserisci qualsiasi soggetto nelle immagini con guida tramite maschera o testo.

Wan 2.2 + Lightx2v V2 | I2V & T2V Ultra Veloce

Configurazione Dual Light LoRA, 4X più veloce.

Flux Upscaler - Ultimate 32k | Image Upscaler

Flux Upscaler – Raggiungi risoluzioni 4k, 8k, 16k e Ultimate 32k!

Pyramid Flow | Generazione Video

Include sia la modalità testo-a-video che immagine-a-video.

FlashVSR | Upscaler Video in Tempo Reale

Migliora i video in modo rapido, fluido e super chiaro—senza perdere dettagli.

Supporto

Risorse

Legale

RunComfy

RunComfy è la piattaforma principale ComfyUI che offre ComfyUI online ambiente e servizi, insieme a workflow di ComfyUI con visuali mozzafiato. RunComfy offre anche AI Models, consentire agli artisti di sfruttare gli ultimi strumenti di AI per creare arte incredibile.

Generazione Musicale ACE-Step | Creazione Audio AI