Generazione Musicale ACE-Step | Creazione Audio AI
ACE-Step è un modello di base open-source rivoluzionario per la generazione musicale che colma il divario tra velocità di generazione e qualità musicale. Integrando la generazione basata sulla diffusione con il Deep Compression AutoEncoder di Sana e un trasformatore lineare leggero, sintetizza fino a 4 minuti di musica di alta qualità in soli 20 secondi—15× più veloce delle alternative basate su LLM. Il modello eccelle nel mantenere la coerenza musicale offrendo un controllo avanzato su testi, clonazione vocale e capacità di remix.ComfyUI ACE-Step Flusso di lavoro

- Workflow completamente operativi
- Nessun nodo o modello mancante
- Nessuna configurazione manuale richiesta
- Presenta visuali mozzafiato
ComfyUI ACE-Step Esempi
ComfyUI ACE-Step Descrizione
1. Cos'è il Workflow ComfyUI ACE-Step?
ComfyUI ACE-Step integra il modello di base per la generazione musicale ACE-Step recentemente sviluppato nell'ambiente ComfyUI. Basato su un'architettura ibrida che combina generazione basata sulla diffusione con il Deep Compression AutoEncoder (DCAE) di Sana e un trasformatore lineare leggero, ACE-Step consente una generazione musicale ultra-rapida e di alta qualità con eccezionali capacità di controllo. Questo workflow permette agli utenti di creare musica originale attraverso generi e stili diversi con semplici prompt in linguaggio naturale e testi.
2. Vantaggi di ComfyUI ACE-Step:
- Velocità Senza Precedenti: Sintetizza fino a 4 minuti di musica in soli 20 secondi—15× più veloce delle alternative basate su LLM
- Coerenza Musicale: ACE-Step mantiene una qualità superiore nelle dimensioni di melodia, armonia e ritmo
- Supporto Multilingue: Genera musica in 19 lingue diverse con prestazioni eccezionali nelle prime 10 lingue
- Controllo Avanzato: Abilita la clonazione vocale, modifica dei testi, remix e generazione di tracce con parametri dettagliati
- Flessibilità Creativa: Supporta diversi stili musicali, generi e strumenti con vari formati di descrizione
- Integrazione Senza Soluzione di Continuità: Si collega direttamente ai workflow ComfyUI per la creazione audio potenziata dall'AI
3. Come Usare il Workflow ComfyUI ACE-Step
3.1 Metodi di Generazione con ComfyUI ACE-Step
Esempio di Configurazione per ACE-Step:
- Prepara gli input:
Nel nodo
TextEncodeAceStepAudio
:- Aggiungi tag descrittivi per lo stile musicale (es. "country rock, folk rock, southern rock, bluegrass, pop")
- Inserisci testi con tag di struttura come [verse], [chorus], [bridge]
- Regola lyrics_strength (1.00 è il predefinito)
- Configura i parametri del nodo
KSampler
:- Regola i passaggi (50 raccomandati per ACE-Step)
- Imposta cfg (4.0 è il predefinito)
- Imposta il valore di denoise (1.00 è il predefinito)
- Nel nodo
EmptyAceStepLatentAudio
:- Imposta la durata desiderata in secondi (30.0 è il predefinito)
- Imposta batch_size
- Clicca il pulsante
Run
per eseguire il workflow ACE-Step - Nel nodo
SaveAudio
: ascolta o salva la tua musica generata
Workflow Principale di Generazione ACE-Step
- Ideale per: Creare musica originale da descrizioni testuali e testi
- Caratteristiche:
- Generazione veloce (15× più veloce delle alternative LLM)
- Forte coerenza e qualità musicale
- Controllo flessibile della durata
Workflows Specializzati ACE-Step (basati su LoRA)
- Lyric2Vocal: Modello ACE-Step perfezionato per generare voci di alta qualità dai testi
- Text2Samples: Variante specializzata ACE-Step per produrre loop e campioni strumentali
- RapMachine: Modello ACE-Step ottimizzato per la generazione rap con vari stili
3.2 Riferimento Parametri per ComfyUI ACE-Step
Nodo TextEncodeAceStepAudio: Questo nodo elabora gli input testuali per guidare la generazione musicale ACE-Step.
clip
: Campo di testo per descrizioni di stile, generi e moodlyrics
: Campo di testo per i testi delle canzoni con tag di struttura opzionalilyrics_strength
: Controlla quanto fortemente i testi influenzano la generazione (predefinito: 1.00)
Nodo KSampler: Controlla il processo di campionamento della diffusione in ACE-Step.
seed
: Imposta il seme di randomizzazione per risultati riproducibilicontrol_after_generate
: Opzioni per il comportamento del seme dopo la generazionesteps
: Numero di passaggi di diffusione (più alto = più raffinamento)cfg
: Scala di guida senza classificatore (più alto = più aderenza al prompt)sampler_name
: Algoritmo utilizzato per il campionamento (res_multistep raccomandato)scheduler
: Tipo di pianificazione del rumore (semplice raccomandato)denoise
: Controlla il livello di rimozione del rumore (1.00 è il denoising completo)
Nodo EmptyAceStepLatentAudio: Inizializza lo spazio di generazione audio.
seconds
: Durata dell'audio generato in secondibatch_size
: Numero di campioni da generare simultaneamente
Nodo VAEDecodeAudio: Decodifica le rappresentazioni latenti in formato udibile.
samples
: Input da KSamplervae
: Modello VAE utilizzato per la decodifica
Nodo SaveAudio: Produce il risultato audio finale di ACE-Step.
filename_prefix
: Prefisso per i file audio salvatiaudio
: Player per l'anteprima dell'audio generato
3.3. Tecniche Avanzate con ComfyUI ACE-Step
Generazione di Variazioni:
- Regola il parametro di varianza per controllare la somiglianza con le generazioni originali di ACE-Step
- Maggiore varianza crea output più divergenti mantenendo gli elementi musicali core
Repainting:
- Rigenera selettivamente sezioni specifiche dell'audio mantenendo il resto
- Utile per correggere segmenti problematici senza cambiare l'intera composizione
Modifica Testi in ACE-Step:
- Modifica i testi mantenendo melodia, timbro vocale e accompagnamento
- Supporta la modifica in più lingue mantenendo la struttura musicale
Clonazione Vocale:
- Preserva le caratteristiche vocali generando nuovo contenuto con ACE-Step
- Può essere combinato con la modifica dei testi per performance vocali flessibili
Trasferimento di Stile:
- Applica nuovi stili musicali a composizioni esistenti
- Mantiene la struttura musicale core adottando caratteristiche di genere diverse
3.4. Suggerimenti per i Prompt ACE-Step:
Per Musica Generale:
- Sii specifico su genere, mood e strumentazione nei prompt ACE-Step
- Esempi di prompt: "electronic, rock, pop" o "funk, pop, soul, melodic"
- Prompt più dettagliati: "dark, death rock, metal, hardcore, electric guitar, powerful, bass, drums, 110 bpm, G major"
Per Musica Strumentale:
- Specifica strumenti e caratteristiche musicali
- Esempi di prompt: "saxophone, jazz" o "violin, solo, fast tempo"
- Prompt più dettagliati: "sonata, piano, Violin, B Flat Major, allegro"
Per Supporto Multilingue:
- ACE-Step funziona meglio con: English, Chinese, Russian, Spanish, Japanese, German, French, Portuguese, Italian, Korean
- Le lingue con scrittura non latina come Chinese, Japanese, e Korean sono ben supportate
Maggiori Informazioni su ACE-Step
Per ulteriori dettagli e riferimenti sullo sviluppo:
- Modello originale ACE-Step di
- Sviluppatori del modello: Junmin Gong, Sean Zhao, Sen Wang, Shengyuan Xu, e Joe Guo
Riconoscimenti
Questo workflow è alimentato da ACE-Step, co-sviluppato da ACE Studio e StepFun. L'integrazione ComfyUI ACE-Step consente una generazione musicale senza soluzione di continuità all'interno dell'ambiente ComfyUI. Tutto il merito va agli autori originali per il loro lavoro rivoluzionario su ACE-Step.