LTX 2.3 Movie Builder Workflow in ComfyUI | Multi-Scene AI Filmmaking

ComfyUI LTX 2.3 Movie Builder Workflow Workflow

Want to run this workflow?

Fully operational workflows
No missing nodes or models
No manual setups required
Features stunning visuals

ComfyUI LTX 2.3 Movie Builder Workflow Examples

LTX 2.3 Movie Builder Workflow: filmmaking coerente, multi‑scena e consapevole dell'audio in ComfyUI#

Il LTX 2.3 Movie Builder Workflow è un sistema di filmmaking AI cinematografico che unisce l'intelligenza dei prompt Qwen/Gemma con il modello video LTX‑2.3 per produrre film multi‑scena coerenti, clip guidati dalla storia e video musicali. Automatizza la pianificazione delle scene, la sequenza dei prompt e l'assemblaggio delle riprese preservando l'identità dei personaggi, la continuità del movimento e il ritmo cinematografico. Puoi ottenere risultati con solo testo, inizi di immagine‑a‑video o riferimenti audio per sincronizzazione labiale e tempi dei gesti, mantenendo il controllo creativo su stile, movimento della telecamera, lunghezza e ordine di montaggio.

Sviluppato da Mickmumpitz.ai per flussi di lavoro di produzione, questo grafico ComfyUI integra la creazione di immagini iniziali con FLUX.2, prompt strutturati, condizionamento consapevole dell'audio, upscaling latente opzionale e un assemblatore di riprese finale. Se hai bisogno di una pipeline pronta per le riprese, il LTX 2.3 Movie Builder Workflow ti porta dai riferimenti e dalle righe di sceneggiatura a un taglio finito con un setup manuale minimo.

Modelli chiave nel Comfyui LTX 2.3 Movie Builder Workflow#

Lightricks LTX‑2.3 22B (solo transformer, FP8): la struttura principale text‑to‑video usata per la generazione immagine‑a‑video e testo‑a‑video. Model
LTX‑2.3 Distilled LoRA 384 1.1: pesi distillati che accelerano e stabilizzano il campionamento LTX‑2.3. LoRA
LTX‑2.3 Spatial Upscaler x2 1.1: upscaler latente opzionale per video più puliti e grandi. Model
LTX‑2.3 Video VAE (BF16) e Audio VAE (BF16): VAE per latenti video e audio LTX. Video VAE · Audio VAE
LTX‑2.3 ID LoRA TalkVid 3k: LoRA consapevole dell'identità che migliora l'identità del parlato e il movimento della bocca. LoRA
Gemma 3 12B IT + LTX‑2.3 Text Projection: pila di codifica testo usata per i prompt LTX. Encoder · Projection
FLUX.2‑klein‑9B FP8: generatore di immagini veloce per frame iniziali, oggetti di scena e look‑dev. Model
FLUX.2‑klein‑9B Consistency LoRA V2 e 360 ERP Outpaint LoRA: migliorano la stabilità temporale e il contesto ampio negli asset. Consistency · 360 ERP
Flux2 VAE e Qwen 3 8B text encoder per FLUX: codificatori usati nel percorso di creazione degli asset. Flux2 VAE · Qwen 3 8B
Percorso opzionale a basso VRAM: LTX‑2.3 GGUF quantized UNet. GGUF

Come usare il Comfyui LTX 2.3 Movie Builder Workflow#

A colpo d'occhio: scegli la risoluzione del tuo film e fps, carica immagini del protagonista (viso/corpo), aggiungi riferimento vocale opzionale, genera un frame iniziale con FLUX o fornisci il tuo fermo immagine, scrivi un prompt strutturato, quindi renderizza la ripresa. Duplica la ripresa per nuove scene e riordinale nell'assemblatore per esportare il film finale.

IMPOSTAZIONI#

Imposta il tuo canvas video e il ritmo nel LtxResolutionPicker (#13492) e Frame Rate (#13480). I controlli di campionamento globale si trovano in Set_steps (#845) e Set_cfg (#851) e influenzano sia la creazione degli asset che la generazione video LTX. Se stai iterando solo su immagini, attiva l'opzione di bypass ENABLE / DISABLE VIDEO GENERATION (#13715) per risparmiare tempo. Queste impostazioni definiscono quanto dura ciascun clip e come si compone nella timeline finale.

CARICA MODELLI LTX#

La pila LTX si carica con UNETLoader (#13450), due nodi Load Distilled LoRA (#10370, #10159), e l'ID LoRA LoraLoaderModelOnly (#10324) per la coerenza dei personaggi. I prompt sono codificati da DualCLIPLoader (#13451) usando Gemma + LTX projection. I VAE video e audio si caricano tramite VAELoader (#13449) e VAELoader (#13832), e l'upscaler latente opzionale è fornito da LatentUpscaleModelLoader (#10349). Il grafico memorizza questi come valori "Get/Set" riutilizzabili in modo che ogni ripresa legga lo stesso pacchetto di modelli.

CARICA MODELLI FLUX#

Per la creazione di immagini iniziali e lo sviluppo del look, il percorso FLUX carica UNETLoader (#1992) con le LoRA di Consistency e 360 ERP (LoraLoaderModelOnly #6228, #13261). Il testo è codificato con CLIPLoader (#362) usando Qwen, e le immagini vengono decodificate con VAELoader (#360). Questa fase è indipendente, quindi puoi iterare rapidamente su oggetti di scena, ambienti o inquadrature iniziali prima di passarli a LTX.

CARICA IMMAGINI DEL PROTAGONISTA#

Aggiungi i tuoi riferimenti di viso e corpo con LoadImage (#4867, #1284) e il set compagno (#13472, #13473) se necessario. La catena di strumenti incorporata "REMOVE BG" ritaglia automaticamente i visi e rimuove gli sfondi per produrre set FACE, BODY, e FACEBODY (Set_FACE #3093, Set_BODY #3291, Set_FACEBODY #1334). Riferimenti puliti sono critici per la conservazione dell'identità tra le riprese.

CREAZIONE ASSET (opzionale)#

Se vuoi che il workflow crei un fermo immagine iniziale preciso, scrivi una descrizione in Text Prompt (#13442) ed esegui il campionatore FLUX KSampler (#13361). Il frame risultante è memorizzato come OUT_01 e salvato tramite SaveImage (#13439), quindi opzionalmente armonizzato con i tuoi riferimenti usando ColorMatch (#13478). Questo diventa l'ancora visiva per il passaggio immagine‑a‑video successivo.

RIFERIMENTO AUDIO (opzionale)#

Carica un riferimento vocale o di performance con LoadAudio (#10343) e taglialo in TrimAudioDuration (#10344); anteprima con PreviewAudio (#10346). L'audio è passato a LTXVReferenceAudio (#13329) quando Enable Voice Reference (#13320) è attivo, guidando le forme della bocca, la frase e i tempi dei gesti. È disponibile uno slot di riferimento secondario (AUDIO REFERENCE 02) se vuoi confrontare o cambiare riprese a metà iterazione.

RIPRESA 01#

Ogni ripresa legge modelli e impostazioni dal pool condiviso, quindi combina i tuoi asset, il prompt e l'audio opzionale in un video. Inserisci una descrizione cinematografica o un prompt guidato dal discorso in Text Prompt (#13384); usa il formato incluso [VISUAL] / [SPEECH] / [SOUNDS] per i migliori risultati. Il fermo immagine iniziale è pre-processato in LTXVPreprocess (#13308) e animato in LTXVImgToVideoInplace (#13289), con condizionamento audio fornito da LTXVReferenceAudio (#13329) quando abilitato. La pipeline esegue un campionatore a due stadi (SamplerCustomAdvanced #13316, #13331) e, se Enable Upscale (#13322) è attivo, affina i dettagli con LTXVLatentUpsampler (#13306). CreateVideo (#13310) multiplica i frame e l'audio; puoi salvare gli output per ripresa tramite ShotVideoOutput (#13379) e Video Output (#13393).

OUTPUT FINALE DEL FILM#

Organizza l'ordine delle riprese con i nodi helper MickmumpitzShotOrder (#8230) e MickmumpitzShotDuplicator (#6357), quindi assembla il tuo taglio in Video Output - Shot Assembler (#5598). L'assemblatore ritaglia e concatena i clip, preparando una singola timeline per l'esportazione. Renderizza il film finale con Video Output (#5521). Per costruire film più lunghi, duplica RIPRESA 01, regola i prompt e le posizioni in/out, e ri-esporta.

Nodi chiave nel Comfyui LTX 2.3 Movie Builder Workflow#

`LTXVImgToVideoInplace` (#13289)#

Trasforma un fermo immagine di alta qualità in un video latente temporalmente coerente preservando identità e composizione. Usalo per convertire inizi FLUX o i tuoi riferimenti in movimento. Abbinalo a una chiara direzione della scena in Text Prompt e mantieni lo stesso seed tra le riprese quando vuoi alternati comparabili.

`LTXVReferenceAudio` (#13329)#

Inietta tempi e spunti fonetici da una traccia vocale o musicale in modo che discorsi e gesti si allineino naturalmente. Funziona meglio con prompt che separano [VISUAL], [SPEECH], e [SOUNDS]. Attiva Enable Voice Reference per passare tra movimento guidato dall'audio e puramente guidato dal prompt.

`LTXVLatentUpsampler` (#13306)#

Affina i dettagli nello spazio latente usando l'LTX‑2.3 Spatial Upscaler per texture e bordi più nitidi. Abilitalo quando le riprese verranno intercalate con primi piani o sovrapposizioni di testo; disabilitalo per iterare più velocemente durante il look‑dev.

`ColorMatch` (#13478)#

Abbina il colore tra il tuo fermo immagine iniziale e un output di riferimento per mantenere la continuità tra le scene. Utile quando si compongono più asset generati da FLUX o si mescolano configurazioni di illuminazione.

`KSampler` (#13361)#

Il generatore di asset FLUX che crea oggetti di scena, location e fermi immagine eroici per la fase video. Blocca i seed per mantenere un linguaggio visivo coerente tra le sequenze, quindi modifica leggermente il testo per esplorare piccoli cambiamenti di stile senza rompere la continuità.

`Video Output - Shot Assembler` (#5598)#

Raccoglie i render delle singole riprese e produce un unico taglio. Usalo per riordinare le scene, ritagliare in modo coerente ed esportare il film in un unico passaggio.

Extra opzionali#

Usa la struttura dei prompt mostrata nel suggerimento del grafico: [VISUAL] descrizione della scena, [SPEECH] parole esatte, [SOUNDS] stile vocale e ambiente. Questo aiuta i codificatori di testo e audio LTX a cooperare.
Mantieni l'identità del personaggio stabile fornendo sia riferimenti di viso che di corpo e abilitando l'LTX‑2.3 ID LoRA.
Per iterazioni rapide, disabilita l'upscaler e il riferimento vocale, accorcia la lunghezza della ripresa e usa il bypass video per generare solo frame iniziali.
Su sistemi a basso VRAM, prova la build GGUF di LTX‑2.3 ed evita di impilare LoRA extra fino ai passaggi finali. GGUF
Duplica RIPRESA 01 per nuove scene, varia i prompt minimamente tra le riprese e riutilizza i seed per mantenere tono e illuminazione stabili da taglio a taglio in tutto il tuo LTX 2.3 Movie Builder Workflow.

Riconoscimenti#

Questo workflow implementa e si basa sui seguenti lavori e risorse. Ringraziamo con gratitudine Mickmumpitz per LTX 2.3 Movie Builder Workflow Source per i loro contributi e la manutenzione. Per dettagli autorevoli, si prega di fare riferimento alla documentazione originale e ai repository collegati di seguito.

Risorse#

Mickmumpitz/LTX 2.3 Movie Builder Workflow Source
- Docs / Note di rilascio: mickmumpitz.ai/posts/new-video-free-i-157336696

Nota: L'uso dei modelli, dataset e codice di riferimento è soggetto alle rispettive licenze e condizioni fornite dai loro autori e manutentori.

Want More ComfyUI Workflows?

LTX 2.3 Da Immagine a Video | Creatore di Movimento Cinematografico

Trasforma le immagini in video realistici e cinematografici con un movimento fluido e coerente.

LTX-2 First Last Frame | Generatore di Video a Fotogrammi Chiave

Trasforma fotogrammi statici in transizioni video e sonore fluide in modo rapido.

LTX-2 ControlNet | Generatore Video di Precisione

Controllo nitido, sincronizzazione perfetta, creazione video AI super chiara.

LTX 2.3 LoRA Inferenza | AI Toolkit ComfyUI

Esegui il tuo LTX 2.3 LoRA addestrato con AI Toolkit in ComfyUI con un comportamento corrispondente all'addestramento utilizzando un singolo nodo personalizzato RunComfy RC.

LTX 2.3 Prompt Relay | Creatore di Video Controllati dalla Scena

Trasforma immagini statiche in clip cinematografici fluidi e guidati dalla storia istantaneamente.

ComfyUI F5 TTS | Motore di Clonazione Vocale Naturale

Trasforma il testo in voci ricche ed espressive con controllo naturale del tono.

Linear Mask Dilation | Animazioni Straordinarie

Trasforma i tuoi soggetti e falli viaggiare attraverso diverse scene senza soluzione di continuità.

Reallusion AI Render | Collezione di Workflows da 3D a ComfyUI

ComfyUI + Reallusion = Velocità, Accessibilità e Facilità per i visual 3D

Supporto

Risorse

Legale

RunComfy

RunComfy è la piattaforma principale ComfyUI che offre ComfyUI online ambiente e servizi, insieme a workflow di ComfyUI con visuali mozzafiato. RunComfy offre anche AI Models, consentire agli artisti di sfruttare gli ultimi strumenti di AI per creare arte incredibile.

LTX 2.3 Movie Builder Workflow | Generatore di Film AI