ComfyUI>Workflow>LTX 2.3 Movie Builder Workflow | Generatore di Film AI

LTX 2.3 Movie Builder Workflow | Generatore di Film AI

Workflow Name: RunComfy/LTX-2.3-Movie-Builder
Workflow ID: 0000...1409
Con il sistema LTX 2.3 Movie Builder, puoi costruire film coesi guidati dall'AI con continuità multi-scena e qualità cinematografica. Semplifica la pianificazione delle scene e la sequenza dei prompt mantenendo la coerenza dei personaggi e del movimento. Puoi creare narrazioni basate su testo-video, immagine-video e audio senza configurazioni manuali complesse. Il sistema assicura transizioni della telecamera fluide e un ritmo realistico per progetti cinematografici più lunghi. Ideale per i creatori, offre velocità, struttura e controllo creativo al tuo processo di filmmaking AI.

ComfyUI LTX 2.3 Movie Builder Workflow Workflow

LTX 2.3 Movie Builder Workflow in ComfyUI | Multi-Scene AI Filmmaking
Want to run this workflow?
  • Fully operational workflows
  • No missing nodes or models
  • No manual setups required
  • Features stunning visuals

ComfyUI LTX 2.3 Movie Builder Workflow Examples

LTX 2.3 Movie Builder Workflow: filmmaking coerente, multi‑scena e consapevole dell'audio in ComfyUI#

Il LTX 2.3 Movie Builder Workflow è un sistema di filmmaking AI cinematografico che unisce l'intelligenza dei prompt Qwen/Gemma con il modello video LTX‑2.3 per produrre film multi‑scena coerenti, clip guidati dalla storia e video musicali. Automatizza la pianificazione delle scene, la sequenza dei prompt e l'assemblaggio delle riprese preservando l'identità dei personaggi, la continuità del movimento e il ritmo cinematografico. Puoi ottenere risultati con solo testo, inizi di immagine‑a‑video o riferimenti audio per sincronizzazione labiale e tempi dei gesti, mantenendo il controllo creativo su stile, movimento della telecamera, lunghezza e ordine di montaggio.

Sviluppato da Mickmumpitz.ai per flussi di lavoro di produzione, questo grafico ComfyUI integra la creazione di immagini iniziali con FLUX.2, prompt strutturati, condizionamento consapevole dell'audio, upscaling latente opzionale e un assemblatore di riprese finale. Se hai bisogno di una pipeline pronta per le riprese, il LTX 2.3 Movie Builder Workflow ti porta dai riferimenti e dalle righe di sceneggiatura a un taglio finito con un setup manuale minimo.

Modelli chiave nel Comfyui LTX 2.3 Movie Builder Workflow#

  • Lightricks LTX‑2.3 22B (solo transformer, FP8): la struttura principale text‑to‑video usata per la generazione immagine‑a‑video e testo‑a‑video. Model
  • LTX‑2.3 Distilled LoRA 384 1.1: pesi distillati che accelerano e stabilizzano il campionamento LTX‑2.3. LoRA
  • LTX‑2.3 Spatial Upscaler x2 1.1: upscaler latente opzionale per video più puliti e grandi. Model
  • LTX‑2.3 Video VAE (BF16) e Audio VAE (BF16): VAE per latenti video e audio LTX. Video VAE · Audio VAE
  • LTX‑2.3 ID LoRA TalkVid 3k: LoRA consapevole dell'identità che migliora l'identità del parlato e il movimento della bocca. LoRA
  • Gemma 3 12B IT + LTX‑2.3 Text Projection: pila di codifica testo usata per i prompt LTX. Encoder · Projection
  • FLUX.2‑klein‑9B FP8: generatore di immagini veloce per frame iniziali, oggetti di scena e look‑dev. Model
  • FLUX.2‑klein‑9B Consistency LoRA V2 e 360 ERP Outpaint LoRA: migliorano la stabilità temporale e il contesto ampio negli asset. Consistency · 360 ERP
  • Flux2 VAE e Qwen 3 8B text encoder per FLUX: codificatori usati nel percorso di creazione degli asset. Flux2 VAE · Qwen 3 8B
  • Percorso opzionale a basso VRAM: LTX‑2.3 GGUF quantized UNet. GGUF

Come usare il Comfyui LTX 2.3 Movie Builder Workflow#

A colpo d'occhio: scegli la risoluzione del tuo film e fps, carica immagini del protagonista (viso/corpo), aggiungi riferimento vocale opzionale, genera un frame iniziale con FLUX o fornisci il tuo fermo immagine, scrivi un prompt strutturato, quindi renderizza la ripresa. Duplica la ripresa per nuove scene e riordinale nell'assemblatore per esportare il film finale.

IMPOSTAZIONI#

Imposta il tuo canvas video e il ritmo nel LtxResolutionPicker (#13492) e Frame Rate (#13480). I controlli di campionamento globale si trovano in Set_steps (#845) e Set_cfg (#851) e influenzano sia la creazione degli asset che la generazione video LTX. Se stai iterando solo su immagini, attiva l'opzione di bypass ENABLE / DISABLE VIDEO GENERATION (#13715) per risparmiare tempo. Queste impostazioni definiscono quanto dura ciascun clip e come si compone nella timeline finale.

CARICA MODELLI LTX#

La pila LTX si carica con UNETLoader (#13450), due nodi Load Distilled LoRA (#10370, #10159), e l'ID LoRA LoraLoaderModelOnly (#10324) per la coerenza dei personaggi. I prompt sono codificati da DualCLIPLoader (#13451) usando Gemma + LTX projection. I VAE video e audio si caricano tramite VAELoader (#13449) e VAELoader (#13832), e l'upscaler latente opzionale è fornito da LatentUpscaleModelLoader (#10349). Il grafico memorizza questi come valori "Get/Set" riutilizzabili in modo che ogni ripresa legga lo stesso pacchetto di modelli.

CARICA MODELLI FLUX#

Per la creazione di immagini iniziali e lo sviluppo del look, il percorso FLUX carica UNETLoader (#1992) con le LoRA di Consistency e 360 ERP (LoraLoaderModelOnly #6228, #13261). Il testo è codificato con CLIPLoader (#362) usando Qwen, e le immagini vengono decodificate con VAELoader (#360). Questa fase è indipendente, quindi puoi iterare rapidamente su oggetti di scena, ambienti o inquadrature iniziali prima di passarli a LTX.

CARICA IMMAGINI DEL PROTAGONISTA#

Aggiungi i tuoi riferimenti di viso e corpo con LoadImage (#4867, #1284) e il set compagno (#13472, #13473) se necessario. La catena di strumenti incorporata "REMOVE BG" ritaglia automaticamente i visi e rimuove gli sfondi per produrre set FACE, BODY, e FACEBODY (Set_FACE #3093, Set_BODY #3291, Set_FACEBODY #1334). Riferimenti puliti sono critici per la conservazione dell'identità tra le riprese.

CREAZIONE ASSET (opzionale)#

Se vuoi che il workflow crei un fermo immagine iniziale preciso, scrivi una descrizione in Text Prompt (#13442) ed esegui il campionatore FLUX KSampler (#13361). Il frame risultante è memorizzato come OUT_01 e salvato tramite SaveImage (#13439), quindi opzionalmente armonizzato con i tuoi riferimenti usando ColorMatch (#13478). Questo diventa l'ancora visiva per il passaggio immagine‑a‑video successivo.

RIFERIMENTO AUDIO (opzionale)#

Carica un riferimento vocale o di performance con LoadAudio (#10343) e taglialo in TrimAudioDuration (#10344); anteprima con PreviewAudio (#10346). L'audio è passato a LTXVReferenceAudio (#13329) quando Enable Voice Reference (#13320) è attivo, guidando le forme della bocca, la frase e i tempi dei gesti. È disponibile uno slot di riferimento secondario (AUDIO REFERENCE 02) se vuoi confrontare o cambiare riprese a metà iterazione.

RIPRESA 01#

Ogni ripresa legge modelli e impostazioni dal pool condiviso, quindi combina i tuoi asset, il prompt e l'audio opzionale in un video. Inserisci una descrizione cinematografica o un prompt guidato dal discorso in Text Prompt (#13384); usa il formato incluso [VISUAL] / [SPEECH] / [SOUNDS] per i migliori risultati. Il fermo immagine iniziale è pre-processato in LTXVPreprocess (#13308) e animato in LTXVImgToVideoInplace (#13289), con condizionamento audio fornito da LTXVReferenceAudio (#13329) quando abilitato. La pipeline esegue un campionatore a due stadi (SamplerCustomAdvanced #13316, #13331) e, se Enable Upscale (#13322) è attivo, affina i dettagli con LTXVLatentUpsampler (#13306). CreateVideo (#13310) multiplica i frame e l'audio; puoi salvare gli output per ripresa tramite ShotVideoOutput (#13379) e Video Output (#13393).

OUTPUT FINALE DEL FILM#

Organizza l'ordine delle riprese con i nodi helper MickmumpitzShotOrder (#8230) e MickmumpitzShotDuplicator (#6357), quindi assembla il tuo taglio in Video Output - Shot Assembler (#5598). L'assemblatore ritaglia e concatena i clip, preparando una singola timeline per l'esportazione. Renderizza il film finale con Video Output (#5521). Per costruire film più lunghi, duplica RIPRESA 01, regola i prompt e le posizioni in/out, e ri-esporta.

Nodi chiave nel Comfyui LTX 2.3 Movie Builder Workflow#

LTXVImgToVideoInplace (#13289)#

Trasforma un fermo immagine di alta qualità in un video latente temporalmente coerente preservando identità e composizione. Usalo per convertire inizi FLUX o i tuoi riferimenti in movimento. Abbinalo a una chiara direzione della scena in Text Prompt e mantieni lo stesso seed tra le riprese quando vuoi alternati comparabili.

LTXVReferenceAudio (#13329)#

Inietta tempi e spunti fonetici da una traccia vocale o musicale in modo che discorsi e gesti si allineino naturalmente. Funziona meglio con prompt che separano [VISUAL], [SPEECH], e [SOUNDS]. Attiva Enable Voice Reference per passare tra movimento guidato dall'audio e puramente guidato dal prompt.

LTXVLatentUpsampler (#13306)#

Affina i dettagli nello spazio latente usando l'LTX‑2.3 Spatial Upscaler per texture e bordi più nitidi. Abilitalo quando le riprese verranno intercalate con primi piani o sovrapposizioni di testo; disabilitalo per iterare più velocemente durante il look‑dev.

ColorMatch (#13478)#

Abbina il colore tra il tuo fermo immagine iniziale e un output di riferimento per mantenere la continuità tra le scene. Utile quando si compongono più asset generati da FLUX o si mescolano configurazioni di illuminazione.

KSampler (#13361)#

Il generatore di asset FLUX che crea oggetti di scena, location e fermi immagine eroici per la fase video. Blocca i seed per mantenere un linguaggio visivo coerente tra le sequenze, quindi modifica leggermente il testo per esplorare piccoli cambiamenti di stile senza rompere la continuità.

Video Output - Shot Assembler (#5598)#

Raccoglie i render delle singole riprese e produce un unico taglio. Usalo per riordinare le scene, ritagliare in modo coerente ed esportare il film in un unico passaggio.

Extra opzionali#

  • Usa la struttura dei prompt mostrata nel suggerimento del grafico: [VISUAL] descrizione della scena, [SPEECH] parole esatte, [SOUNDS] stile vocale e ambiente. Questo aiuta i codificatori di testo e audio LTX a cooperare.
  • Mantieni l'identità del personaggio stabile fornendo sia riferimenti di viso che di corpo e abilitando l'LTX‑2.3 ID LoRA.
  • Per iterazioni rapide, disabilita l'upscaler e il riferimento vocale, accorcia la lunghezza della ripresa e usa il bypass video per generare solo frame iniziali.
  • Su sistemi a basso VRAM, prova la build GGUF di LTX‑2.3 ed evita di impilare LoRA extra fino ai passaggi finali. GGUF
  • Duplica RIPRESA 01 per nuove scene, varia i prompt minimamente tra le riprese e riutilizza i seed per mantenere tono e illuminazione stabili da taglio a taglio in tutto il tuo LTX 2.3 Movie Builder Workflow.

Riconoscimenti#

Questo workflow implementa e si basa sui seguenti lavori e risorse. Ringraziamo con gratitudine Mickmumpitz per LTX 2.3 Movie Builder Workflow Source per i loro contributi e la manutenzione. Per dettagli autorevoli, si prega di fare riferimento alla documentazione originale e ai repository collegati di seguito.

Risorse#

Nota: L'uso dei modelli, dataset e codice di riferimento è soggetto alle rispettive licenze e condizioni fornite dai loro autori e manutentori.

RunComfy
Copyright 2026 RunComfy. Tutti i Diritti Riservati.

RunComfy è la piattaforma principale ComfyUI che offre ComfyUI online ambiente e servizi, insieme a workflow di ComfyUI con visuali mozzafiato. RunComfy offre anche AI Models, consentire agli artisti di sfruttare gli ultimi strumenti di AI per creare arte incredibile.