ComfyUI  >  Workflow  >  Generazione Musicale ACE-Step | Creazione Audio AI

Generazione Musicale ACE-Step | Creazione Audio AI

ACE-Step è un modello di base open-source rivoluzionario per la generazione musicale che colma il divario tra velocità di generazione e qualità musicale. Integrando la generazione basata sulla diffusione con il Deep Compression AutoEncoder di Sana e un trasformatore lineare leggero, sintetizza fino a 4 minuti di musica di alta qualità in soli 20 secondi—15× più veloce delle alternative basate su LLM. Il modello eccelle nel mantenere la coerenza musicale offrendo un controllo avanzato su testi, clonazione vocale e capacità di remix.

ComfyUI ACE-Step Flusso di lavoro

ACE-Step Music Generation Model in ComfyUI | AI Audio Creation
Vuoi eseguire questo workflow?
  • Workflow completamente operativi
  • Nessun nodo o modello mancante
  • Nessuna configurazione manuale richiesta
  • Presenta visuali mozzafiato

ComfyUI ACE-Step Esempi

ComfyUI ACE-Step Descrizione

1. Cos'è il Workflow ComfyUI ACE-Step?

ComfyUI ACE-Step integra il modello di base per la generazione musicale ACE-Step recentemente sviluppato nell'ambiente ComfyUI. Basato su un'architettura ibrida che combina generazione basata sulla diffusione con il Deep Compression AutoEncoder (DCAE) di Sana e un trasformatore lineare leggero, ACE-Step consente una generazione musicale ultra-rapida e di alta qualità con eccezionali capacità di controllo. Questo workflow permette agli utenti di creare musica originale attraverso generi e stili diversi con semplici prompt in linguaggio naturale e testi.

2. Vantaggi di ComfyUI ACE-Step:

  • Velocità Senza Precedenti: Sintetizza fino a 4 minuti di musica in soli 20 secondi—15× più veloce delle alternative basate su LLM
  • Coerenza Musicale: ACE-Step mantiene una qualità superiore nelle dimensioni di melodia, armonia e ritmo
  • Supporto Multilingue: Genera musica in 19 lingue diverse con prestazioni eccezionali nelle prime 10 lingue
  • Controllo Avanzato: Abilita la clonazione vocale, modifica dei testi, remix e generazione di tracce con parametri dettagliati
  • Flessibilità Creativa: Supporta diversi stili musicali, generi e strumenti con vari formati di descrizione
  • Integrazione Senza Soluzione di Continuità: Si collega direttamente ai workflow ComfyUI per la creazione audio potenziata dall'AI

3. Come Usare il Workflow ComfyUI ACE-Step

3.1 Metodi di Generazione con ComfyUI ACE-Step

Esempio di Configurazione per ACE-Step:

  1. Prepara gli input: Nel nodo TextEncodeAceStepAudio:
    • Aggiungi tag descrittivi per lo stile musicale (es. "country rock, folk rock, southern rock, bluegrass, pop")
    • Inserisci testi con tag di struttura come [verse], [chorus], [bridge]
    • Regola lyrics_strength (1.00 è il predefinito)
  2. Configura i parametri del nodo KSampler:
    • Regola i passaggi (50 raccomandati per ACE-Step)
    • Imposta cfg (4.0 è il predefinito)
    • Imposta il valore di denoise (1.00 è il predefinito)
  3. Nel nodo EmptyAceStepLatentAudio:
    • Imposta la durata desiderata in secondi (30.0 è il predefinito)
    • Imposta batch_size
  4. Clicca il pulsante Run per eseguire il workflow ACE-Step
  5. Nel nodo SaveAudio: ascolta o salva la tua musica generata
Workflow Principale di Generazione ACE-Step
  • Ideale per: Creare musica originale da descrizioni testuali e testi
  • Caratteristiche:
    • Generazione veloce (15× più veloce delle alternative LLM)
    • Forte coerenza e qualità musicale
    • Controllo flessibile della durata
Workflows Specializzati ACE-Step (basati su LoRA)
  • Lyric2Vocal: Modello ACE-Step perfezionato per generare voci di alta qualità dai testi
  • Text2Samples: Variante specializzata ACE-Step per produrre loop e campioni strumentali
  • RapMachine: Modello ACE-Step ottimizzato per la generazione rap con vari stili

3.2 Riferimento Parametri per ComfyUI ACE-Step

Nodo TextEncodeAceStepAudio: Questo nodo elabora gli input testuali per guidare la generazione musicale ACE-Step.

  • clip: Campo di testo per descrizioni di stile, generi e mood
  • lyrics: Campo di testo per i testi delle canzoni con tag di struttura opzionali
  • lyrics_strength: Controlla quanto fortemente i testi influenzano la generazione (predefinito: 1.00)

Nodo KSampler: Controlla il processo di campionamento della diffusione in ACE-Step.

  • seed: Imposta il seme di randomizzazione per risultati riproducibili
  • control_after_generate: Opzioni per il comportamento del seme dopo la generazione
  • steps: Numero di passaggi di diffusione (più alto = più raffinamento)
  • cfg: Scala di guida senza classificatore (più alto = più aderenza al prompt)
  • sampler_name: Algoritmo utilizzato per il campionamento (res_multistep raccomandato)
  • scheduler: Tipo di pianificazione del rumore (semplice raccomandato)
  • denoise: Controlla il livello di rimozione del rumore (1.00 è il denoising completo)

Nodo EmptyAceStepLatentAudio: Inizializza lo spazio di generazione audio.

  • seconds: Durata dell'audio generato in secondi
  • batch_size: Numero di campioni da generare simultaneamente

Nodo VAEDecodeAudio: Decodifica le rappresentazioni latenti in formato udibile.

  • samples: Input da KSampler
  • vae: Modello VAE utilizzato per la decodifica

Nodo SaveAudio: Produce il risultato audio finale di ACE-Step.

  • filename_prefix: Prefisso per i file audio salvati
  • audio: Player per l'anteprima dell'audio generato

3.3. Tecniche Avanzate con ComfyUI ACE-Step

Generazione di Variazioni:

  • Regola il parametro di varianza per controllare la somiglianza con le generazioni originali di ACE-Step
  • Maggiore varianza crea output più divergenti mantenendo gli elementi musicali core

Repainting:

  • Rigenera selettivamente sezioni specifiche dell'audio mantenendo il resto
  • Utile per correggere segmenti problematici senza cambiare l'intera composizione

Modifica Testi in ACE-Step:

  • Modifica i testi mantenendo melodia, timbro vocale e accompagnamento
  • Supporta la modifica in più lingue mantenendo la struttura musicale

Clonazione Vocale:

  • Preserva le caratteristiche vocali generando nuovo contenuto con ACE-Step
  • Può essere combinato con la modifica dei testi per performance vocali flessibili

Trasferimento di Stile:

  • Applica nuovi stili musicali a composizioni esistenti
  • Mantiene la struttura musicale core adottando caratteristiche di genere diverse

3.4. Suggerimenti per i Prompt ACE-Step:

Per Musica Generale:

  • Sii specifico su genere, mood e strumentazione nei prompt ACE-Step
  • Esempi di prompt: "electronic, rock, pop" o "funk, pop, soul, melodic"
  • Prompt più dettagliati: "dark, death rock, metal, hardcore, electric guitar, powerful, bass, drums, 110 bpm, G major"

Per Musica Strumentale:

  • Specifica strumenti e caratteristiche musicali
  • Esempi di prompt: "saxophone, jazz" o "violin, solo, fast tempo"
  • Prompt più dettagliati: "sonata, piano, Violin, B Flat Major, allegro"

Per Supporto Multilingue:

  • ACE-Step funziona meglio con: English, Chinese, Russian, Spanish, Japanese, German, French, Portuguese, Italian, Korean
  • Le lingue con scrittura non latina come Chinese, Japanese, e Korean sono ben supportate

Maggiori Informazioni su ACE-Step

Per ulteriori dettagli e riferimenti sullo sviluppo:

  • Modello originale ACE-Step di
  • Sviluppatori del modello: Junmin Gong, Sean Zhao, Sen Wang, Shengyuan Xu, e Joe Guo

Riconoscimenti

Questo workflow è alimentato da ACE-Step, co-sviluppato da ACE Studio e StepFun. L'integrazione ComfyUI ACE-Step consente una generazione musicale senza soluzione di continuità all'interno dell'ambiente ComfyUI. Tutto il merito va agli autori originali per il loro lavoro rivoluzionario su ACE-Step.

Vuoi Altri Workflow di ComfyUI?

RunComfy
Copyright 2025 RunComfy. Tutti i Diritti Riservati.

RunComfy è la piattaforma principale ComfyUI che offre ComfyUI online ambiente e servizi, insieme a workflow di ComfyUI con visuali mozzafiato. RunComfy offre anche AI Playground, consentire agli artisti di sfruttare gli ultimi strumenti di AI per creare arte incredibile.