Ace Step 1.5 nel flusso di lavoro ComfyUI | Diffusione da Testo a Musica

ComfyUI Ace Step 1.5 Workflow

Ace Step 1.5 in ComfyUI Workflow | Text-to-Music Diffusion

Want to run this workflow?

Fully operational workflows
No missing nodes or models
No manual setups required
Features stunning visuals

ComfyUI Ace Step 1.5 Examples

Flusso di lavoro da testo a musica Ace Step 1.5 per ComfyUI#

Questo modello trasforma un breve brief creativo e testi opzionali in un MP3 finito utilizzando Ace Step 1.5. È progettato per musicisti, produttori e creatori che desiderano una generazione di canzoni rapida e di alta qualità con struttura coerente, voci e controllo stilistico dal testo. Il flusso di lavoro si concentra su un percorso diretto da testo a musica, così puoi passare dall'idea all'audio in un solo passaggio.

Ace Step 1.5 abbina un modulo di pianificazione a un trasformatore di diffusione per offrire continuità musicale di grado commerciale pur rimanendo abbastanza leggero per l'hardware di tutti i giorni. In questo grafico ComfyUI, Ace Step 1.5 accetta un suggerimento di stile più testi, pianifica l'arrangiamento, sintetizza una rappresentazione audio latente, quindi decodifica e salva un file pronto da condividere.

Modelli chiave nel flusso di lavoro Comfyui Ace Step 1.5#

Checkpoint Ace Step 1.5 Turbo AIO. Il modello di base che mappa testo e testi in musica e gestisce la sintesi basata sulla diffusione nel dominio audio. Disponibile da Comfy-Org su Hugging Face come parte del set di file ComfyUI: Comfy-Org/ace_step_1.5_ComfyUI_files.
Codificatore di testo Ace Step 1.5. Confezionato con il checkpoint e utilizzato per convertire il tuo suggerimento di prosa e testi opzionali in condizionamento per il generatore. Esposto nel grafico dal nodo TextEncodeAceStepAudio1.5.
VAE audio Ace Step 1.5. Anche confezionato nel checkpoint e utilizzato per decodificare il sintetizzato latente in una forma d'onda del dominio temporale per l'esportazione.

Come utilizzare il flusso di lavoro Comfyui Ace Step 1.5#

A un livello alto carichi il modello Ace Step 1.5, scegli la durata della canzone, descrivi la musica e incolli i testi, quindi esegui il campionamento per sintetizzare e decodificare in MP3.

Step 1 - Carica Modello#

Questo gruppo inizializza le risorse principali tramite CheckpointLoaderSimple (#97). Selezionando il file Ace Step 1.5 Turbo AIO si carica il modello, il suo codificatore di testo e l'audio VAE in un solo passaggio. Il nodo ModelSamplingAuraFlow (#78) attacca una configurazione di campionatore compatibile con Ace Step 1.5 in modo che il KSampler a valle possa funzionare con l'algoritmo previsto. Una volta impostato, il resto del flusso di lavoro può essere guidato puramente dal tuo suggerimento e dalla durata.

Step 2 - Durata#

Qui il controllo Song Duration (#99) alimenta secondi a EmptyAceStep1.5LatentAudio (#98), che prealloca la lunghezza latente target per la traccia. Impostare una lunghezza più breve è ottimo per rapida ideazione e controlli di stile, mentre valori più lunghi permettono ad Ace Step 1.5 di pianificare sezioni più complete. La durata scorre in avanti in modo che il codificatore e il campionatore siano d'accordo su quanta struttura generare. Se successivamente estendi la canzone, mantieni lo stesso seme per preservare l'atmosfera e i motivi.

Step 3 - Suggerimento#

Usa TextEncodeAceStepAudio1.5 (#94) per descrivere lo stile, l'umore, la strumentazione e le note di produzione e incolla eventualmente i testi. Ace Step 1.5 legge questo per pianificare melodia, armonia, ritmo e fraseggio vocale con sezioni coerenti. La linea seed (#102) rende i risultati ripetibili o casuali a tua scelta. Un ConditioningZeroOut (#47) invia un condizionamento negativo neutro per ridurre i conflitti, che è spesso un buon default per le uscite musicali. Se desideri un suggerimento negativo più rigoroso, sostituisci quel nodo con il tuo percorso di testo negativo.

`KSampler` (#3)#

Questo nodo esegue il processo di diffusione effettivo utilizzando la connessione del modello Ace Step 1.5 da ModelSamplingAuraFlow (#78), il condizionamento positivo dal tuo suggerimento, il condizionamento negativo neutro e la lunghezza latente preallocata. Trasforma il rumore in un latente strutturato che riflette le tue istruzioni di testo e i testi. Per una rapida ideazione puoi mantenere il runtime conservativo, quindi aumentare la qualità quando fissi un concetto. Lo stesso seme produce una struttura coerente tra i take in modo da poter confrontare le scelte del campionatore.

`VAEDecodeAudio` (#18)#

Dopo il campionamento, questo nodo converte la rappresentazione audio latente di nuovo in una forma d'onda del dominio temporale utilizzando il VAE Ace Step 1.5. Preserva la forma musicale pianificata durante la codifica mentre leviga i dettagli fini introdotti durante la diffusione. L'output è un segnale audio a banda completa pronto per l'esportazione.

`SaveAudioMP3` (#104)#

Infine, la forma d'onda viene scritta in un file MP3 nelle tue uscite standard ComfyUI. Scegli un bitrate appropriato per il tuo obiettivo e il rendering. Questo ti dà un file condivisibile compatto mantenendo il latente originale disponibile per ri-esecuzioni se regoli i suggerimenti o i semi.

Nodi chiave nel flusso di lavoro Comfyui Ace Step 1.5#

`TextEncodeAceStepAudio1.5` (#94)#

Trasforma il tuo brief creativo e i testi in condizionamento che Ace Step 1.5 comprende. Per il controllo, regola il linguaggio, la tonalità musicale e il tempo per guidare il fraseggio e l'armonia e imposta la struttura delle sezioni quando desideri più o meno cambiamenti di forma. Usa note di produzione descrittive come genere, umore e indizi di mix per ancorare lo stile. Mantieni i testi concisi e metrici per un fraseggio vocale più pulito.

`KSampler` (#3)#

Guida il processo di diffusione che trasforma la pianificazione in latenti audio. Aumenta i passaggi per più dettagli e stabilità, o riducili per anteprime molto veloci. Prova metodi di campionamento alternativi se desideri un comportamento transitorio diverso, quindi mantieni il seme fisso per rendere i confronti equi. Aumenta la forza di guida per una maggiore aderenza al tuo suggerimento Ace Step 1.5, abbassala per una libera improvvisazione.

`EmptyAceStep1.5LatentAudio` (#98)#

Assegna la lunghezza della canzone target come un tensore latente in modo che ogni fase a valle lavori sulla stessa durata. Imposta questo sul numero di secondi che desideri nel rendering finale. Latenti più lunghi richiedono più calcolo e possono beneficiare di impostazioni di qualità leggermente più elevate nel campionatore.

`ModelSamplingAuraFlow` (#78)#

Attacca una strategia di campionamento compatibile con Ace Step 1.5 che bilancia velocità e coerenza musicale. Usalo quando desideri iterazioni reattive che mantengano comunque intatta la struttura globale. Se sperimenti con famiglie di campionatori diverse, usa lo stesso seme per valutare come cambiano i tempi e i transitori.

`SaveAudioMP3` (#104)#

Esporta la forma d'onda decodificata in un file compresso. Seleziona il bitrate per bilanciare dimensione e fedeltà per la tua destinazione di rilascio o condivisione. Per l'archiviazione o il missaggio, puoi sostituirlo con un nodo di salvataggio WAV nella stessa posizione.

`ConditioningZeroOut` (#47)#

Fornisce un condizionamento negativo neutro, che è un'impostazione predefinita sicura per la generazione musicale guidata dai testi. Sostituiscilo con un suggerimento negativo personalizzato se hai bisogno di esclusioni esplicite come nessuna voce o meno artefatti ad alta frequenza. Mantieni le istruzioni positive e negative concettualmente distinte per evitare conflitti.

Extra opzionali#

Inizia con 30–60 secondi per validare lo stile, quindi estendi la durata per completare la traccia mantenendo fisso il seme.
Per strumentali con Ace Step 1.5, dillo esplicitamente nel suggerimento o metti "no vocals" in un percorso di suggerimento negativo.
Tratta i testi come linee cantabili con fraseggio naturale e conteggi sillabici coerenti per migliorare i risultati vocali.
Salva i semi promettenti insieme ai suggerimenti in modo da poterli rivisitare e ingrandire in seguito senza perdere l'identità della canzone.

Riferimenti utili: il progetto ComfyUI su GitHub per informazioni generali sull'uso ComfyUI e i file Ace Step 1.5 ComfyUI su Hugging Face per il checkpoint e le risorse Comfy-Org/ace_step_1.5_ComfyUI_files.

Ringraziamenti#

Questo flusso di lavoro implementa e si basa sui seguenti lavori e risorse. Ringraziamo con gratitudine Comfy.org per il flusso di lavoro Ace Step 1.5 per i loro contributi e la manutenzione. Per dettagli autorevoli, si prega di fare riferimento alla documentazione originale e ai repository collegati di seguito.

Risorse#

Fonte del flusso di lavoro Comfy.org/Ace Step 1.5
- Documenti / Note di rilascio: Ace Step 1.5 è ora disponibile in ComfyUI

Nota: L'uso dei modelli, dei set di dati e del codice di riferimento è soggetto alle rispettive licenze e termini forniti dai loro autori e manutentori.

Want More ComfyUI Workflows?

Generazione Musicale ACE-Step | Creazione Audio AI

Genera musica di qualità da studio 15× più velocemente con la tecnologia di diffusione rivoluzionaria.

MMAudio | Da Video a Audio

MMAudio: Modello avanzato da video a audio per la generazione di audio di alta qualità.

Wan 2.1 | Generazione Video Rivoluzionaria

Crea video incredibili da testo o immagini con l'innovativa AI che funziona su CPU di tutti i giorni.

Wan 2.1 LoRA

Migliora la generazione video Wan 2.1 con modelli LoRA per uno stile e una personalizzazione avanzati.

Hunyuan Image 2.1 | Generatore di Immagini AI ad Alta Risoluzione

Modello di nuova generazione 2.1 per visuali AI nitide, chiare e ultra-definite velocemente.

SUPIR | Upscaler Foto-Realistico per Immagini/Video

SUPIR consente il restauro foto-realistico delle immagini, funziona con il modello SDXL e supporta il miglioramento dei prompt testuali.

LayerDiffuse + TripoSR | Da immagine a 3D

Usa LayerDiffuse per la trasparenza delle immagini e TripoSR per la rapida creazione di oggetti 3D

FlashVSR | Upscaler Video in Tempo Reale

Migliora i video in modo rapido, fluido e super chiaro—senza perdere dettagli.

Supporto

Risorse

Legale

RunComfy

RunComfy è la piattaforma principale ComfyUI che offre ComfyUI online ambiente e servizi, insieme a workflow di ComfyUI con visuali mozzafiato. RunComfy offre anche AI Models, consentire agli artisti di sfruttare gli ultimi strumenti di AI per creare arte incredibile.

Ace Step 1.5 | Generatore di Musica AI di Grado Commerciale

ComfyUI Ace Step 1.5 Workflow

ComfyUI Ace Step 1.5 Examples

Flusso di lavoro da testo a musica Ace Step 1.5 per ComfyUI#

Modelli chiave nel flusso di lavoro Comfyui Ace Step 1.5#

Come utilizzare il flusso di lavoro Comfyui Ace Step 1.5#

Step 1 - Carica Modello#

Step 2 - Durata#

Step 3 - Suggerimento#

KSampler (#3)#

VAEDecodeAudio (#18)#

SaveAudioMP3 (#104)#

Nodi chiave nel flusso di lavoro Comfyui Ace Step 1.5#

TextEncodeAceStepAudio1.5 (#94)#

KSampler (#3)#

EmptyAceStep1.5LatentAudio (#98)#

ModelSamplingAuraFlow (#78)#

SaveAudioMP3 (#104)#

ConditioningZeroOut (#47)#

Extra opzionali#

Ringraziamenti#

Risorse#

Want More ComfyUI Workflows?

Generazione Musicale ACE-Step | Creazione Audio AI

MMAudio | Da Video a Audio

Wan 2.1 | Generazione Video Rivoluzionaria

Wan 2.1 LoRA

Hunyuan Image 2.1 | Generatore di Immagini AI ad Alta Risoluzione

SUPIR | Upscaler Foto-Realistico per Immagini/Video

LayerDiffuse + TripoSR | Da immagine a 3D

FlashVSR | Upscaler Video in Tempo Reale

`KSampler` (#3)#

`VAEDecodeAudio` (#18)#

`SaveAudioMP3` (#104)#

`TextEncodeAceStepAudio1.5` (#94)#

`KSampler` (#3)#

`EmptyAceStep1.5LatentAudio` (#98)#

`ModelSamplingAuraFlow` (#78)#

`SaveAudioMP3` (#104)#

`ConditioningZeroOut` (#47)#