LTX 2.3 Modifica Qualsiasi Cosa: flusso di lavoro di modifica video‑a‑video basato su prompt per ComfyUI#
Questo flusso di lavoro trasforma una richiesta di modifica in inglese semplice in una modifica video temporalmente coerente utilizzando LTX‑2.3 con il LTX 2.3 Modifica Qualsiasi Cosa LoRA. Invece di rigenerare una scena, si ancora al tuo clip di input e applica modifiche localizzate o globali preservando movimento, identità e tempistica. Gli usi tipici includono inserimento o rimozione di oggetti, pulizia dello sfondo, sostituzioni mirate e restyling creativo.
Il grafico raggruppa la normalizzazione del prompt, il condizionamento del frame guida e un percorso di generazione a passaggio unico seguito da interpolazione dei frame opzionale e anti‑aliasing. Puoi esportare il clip modificato e un confronto affiancato con la fonte. LTX 2.3 Modifica Qualsiasi Cosa è il centro di questo flusso di lavoro: fornisce un ampio controllo modificabile basato su prompt mantenendo l'aspetto ad alta fedeltà di LTX‑2.3.
Modelli chiave nel flusso di lavoro Comfyui LTX 2.3 Modifica Qualsiasi Cosa#
- LTX‑2.3 trasformatore di diffusione video base di Lightricks. Spina dorsale della generazione video che prevede fotogrammi temporalmente consistenti da testo e guide. Model card • Repo
- LTX 2.3 Modifica Qualsiasi Cosa LoRA. LoRA specializzata per la modifica che consente operazioni di aggiunta/rimozione/sostituzione/stile senza perdere la struttura della scena. Model
- LTX‑2.3 LoRA distillata 384. Distillazione che consente programmi di campionamento più brevi mantenendo la qualità; utile quando desideri modifiche più veloci. Model
- Gemma 3 12B Codificatore di testo Instruct + Proiezione di testo LTX‑2.3. Codifica la didascalia normalizzata in incorporamenti di condizionamento per LTX‑2.3. Files
- LTX‑2.3 Video VAE e Audio VAE. Comprimi e decodifica latenti video e audio usati lungo la pipeline. Files
- LTX‑2.3 Upscaler Spaziali e Temporali. Upscaler latenti opzionali per fotogrammi più nitidi e movimento più stabile quando miri oltre la risoluzione del primo passaggio. Spatial x2 • Temporal x2
- RIFE (Stima del Flusso Intermedio in Tempo Reale). Modello di interpolazione dei fotogrammi che raddoppia il FPS di riproduzione per un movimento più fluido nell'esportazione finale. Repo • ComfyUI extension
Come usare il flusso di lavoro Comfyui LTX 2.3 Modifica Qualsiasi Cosa#
A un livello alto, carichi un video, descrivi la modifica e avvii la generazione. Il flusso di lavoro normalizza la tua richiesta in una didascalia in stile addestramento, condiziona LTX‑2.3 con frame guida dal clip sorgente e campiona un risultato modificato. La post‑elaborazione opzionale interpola i fotogrammi e applica un anti‑aliasing adattivo prima dell'esportazione.
Impostazioni Video#
Usa questo gruppo per definire tempistica del clip e dimensione di output. Imposta FPS e Durata (Secondi) per corrispondere al tuo obiettivo; il grafico calcola un conteggio dei fotogrammi allineato per un campionamento stabile. Scegli Risoluzione (Dimensione più lunga) per il tuo lato lungo target, quindi imposta opzionalmente Fattore di Ridimensionamento Video se desideri un primo passaggio più veloce e più piccolo. Se pianifichi di mantenere un singolo passaggio, preferisci un fattore di 1.0 per un output a dimensione nativa.
Input#
Carica il tuo clip sorgente in VHS_LoadVideo e lascia che il flusso di lavoro gestisca il ridimensionamento. I fotogrammi sono ridimensionati al lato lungo scelto e opzionalmente ridotti per velocità, quindi passati attraverso LTXVPreprocess per preparare per LTX‑2.3. Lo stesso input è memorizzato come "video di controllo" che in seguito ancora movimento e contenuto in modo che la modifica segua la scena originale.
Prompt#
Inserisci la tua richiesta in Descrivi il compito qui (Prompt). Un passaggio TextGenerate integrato lo riscrive in una singola didascalia in stile dataset come "Rimuovi la piccola auto rossa sullo sfondo." La didascalia normalizzata è visualizzata in "Prompt Finale" e quindi codificata per il condizionamento. Puoi anche digitare una didascalia esatta nell'encoder "Prompt Manuale" se preferisci il controllo completo.
Modello#
Il loader inizializza la spina dorsale LTX‑2.3 e collega le LoRA. Usa il modello base per la fedeltà generale e aggiungi il LTX 2.3 Modifica Qualsiasi Cosa LoRA per l'editabilità. Includi opzionalmente la LoRA distillata se desideri programmi più brevi mantenendo la coerenza. I VAE video e audio sono preparati qui per la codifica/decodifica latente.
Genera Bassa Risoluzione#
Il flusso di lavoro trasforma la tua didascalia in condizionamento positivo/negativo e imposta il frame rate video in modo che la guida temporale corrisponda al tuo target. LTXVAddGuideMulti inietta informazioni guida dal video di controllo, che aiuta a preservare identità, layout e movimento mentre viene applicata la modifica. Un campionatore personalizzato quindi denoises dal rumore guidato verso un AV latente modificato, bilanciando l'aderenza al prompt con la conservazione della struttura. Dopo il campionamento, il latente video è decodificato per produrre i fotogrammi modificati del primo passaggio.
Latente Vuoto#
Questo percorso prepara latenti audio/video usati dal campionatore. Di default un latente audio vuoto è concatenato in modo da poter rendere anche quando non modifichi l'audio. Per localizzare le modifiche, SolidMask insieme a SetLatentNoiseMask può limitare dove viene iniettato nuovo rumore, utile per sostituire un singolo oggetto senza toccare il resto della scena.
Audio#
Se il tuo clip sorgente include audio, può essere passato inalterato; altrimenti il grafico crea una traccia silenziosa per un'esportazione affidabile. Puoi anche caricare o registrare audio personalizzato e tagliarlo per corrispondere alla tua durata. Per modifiche focalizzate puramente sui visivi, puoi rimuovere l'audio dai passaggi finali di combinazione.
Risultato a 1 Passaggio#
Quest'area visualizza in anteprima i fotogrammi modificati e assembla un confronto affiancato "prima vs dopo" utilizzando il video di controllo. È ideale per verificare rapidamente se il prompt LTX 2.3 Modifica Qualsiasi Cosa ha mirato alla regione giusta, preservato il movimento e rispettato la composizione della scena. Puoi esportare questo confronto come un artefatto condivisibile rapidamente.
Post‑Elaborazione#
Se desideri un movimento più fluido, la fase RIFE VFI interpola tra i fotogrammi per raddoppiare il FPS. VideoAdaptiveAA quindi applica un anti‑aliasing leggero per pulire i bordi prima della codifica finale. L'esportatore scrive il risultato a un FPS doppio rispetto all'originale in modo che il movimento sembri naturale senza aumentare il costo di campionamento iniziale.
Nodi chiave nel flusso di lavoro Comfyui LTX 2.3 Modifica Qualsiasi Cosa#
TextGenerate (#178)#
Converte richieste informali in una singola didascalia in stile addestramento che LTX‑2.3 comprende bene, migliorando la precisione della modifica e la stabilità temporale. Usalo quando desideri una fraseologia coerente tra i progetti; se hai bisogno di una formulazione esatta, inseriscila direttamente nel "Prompt Manuale." Riferimento: la gestione dei prompt di LTX‑2.3 nel repo ufficiale fornisce il contesto più ampio per il comportamento di condizionamento. Docs
LTXVConditioning (#51)#
Confeziona il condizionamento positivo e negativo con il frame rate previsto in modo che i token temporali si allineino al tuo clip. Mantieni il frame_rate coerente con il tuo export per evitare derive; questo aiuta LTX 2.3 Modifica Qualsiasi Cosa a preservare il movimento mentre applica la modifica. Raramente hai bisogno di negativi pesanti; negativi concisi possono bastare per sopprimere artefatti indesiderati.
LTXVAddGuideMulti (#104)#
Collega uno o più frame guida dal video di controllo al latente in modo che la modifica tracci la struttura e la tempistica originali. Cambiare con quale frame guidi può influenzare la preservazione dell'identità e la coerenza della posa. Per modifiche localizzate, abbina questo con una maschera in modo che solo la regione target riceva rumore significativo.
SetLatentNoiseMask (#75)#
Definisce dove il campionatore è autorizzato ad aggiungere o mantenere il rumore, controllando efficacemente le regioni di modifica. Una maschera completamente bianca modifica l'intero frame; le maschere morbide sono ideali per fondere le sostituzioni in sfondi affollati. Sostituisci SolidMask con una maschera dipinta quando hai bisogno di un controllo spaziale preciso.
SamplerCustomAdvanced (#38)#
Guida il processo di denoising utilizzando il campionatore e il programma scelti. I programmi più brevi sono più veloci ma beneficiano della LoRA distillata; quelli più lunghi possono aumentare l'aderenza a costo di tempo. Se desideri un aspetto diverso o un profilo di stabilità, prova campionatori alternativi mantenendo lo stesso setup di guida. Riferimento: i documenti del campionatore ComfyUI spiegano come campionatore e programmi sigma interagiscono. ComfyUI
RIFE VFI (#205)#
Interpola fotogrammi intermedi per aumentare la fluidità senza ricampionare il modello di diffusione. È un passaggio post che preserva il contenuto migliorando la cadenza del movimento. Riferimento: modello RIFE e integrazione ComfyUI. Model • Extension
Extra opzionali#
- Modifiche locali prima: Usa una maschera dipinta con
SetLatentNoiseMaskper limitare strettamente dove LTX 2.3 Modifica Qualsiasi Cosa applica le modifiche, quindi allarga la maschera se i bordi sembrano troppo nitidi. - Iterazione più veloce: Riduci
Fattore di Ridimensionamento Videoper prove rapide, quindi torna a1.0per il render finale o aggiungi gli upscaler spaziali/temporali per una nitidezza extra. - Sorgenti senza audio: Se l'input non ha audio, disabilita l'audio nella combinazione finale per evitare errori di muxing, o fornisci una traccia silenziosa tramite i nodi forniti.
- Nota di pianificazione: Il programma "bong_tangent" mostrato nel grafico richiede il pacchetto node RES4LYF; se lo selezioni, installa prima l'estensione. Repo
- Confronti: Usa l'export affiancato integrato per verificare che identità, illuminazione e movimento della telecamera siano preservati prima di impegnarti in render lunghi.
Questo template ComfyUI abbina la spina dorsale ad alta fedeltà di LTX‑2.3 con il LTX 2.3 Modifica Qualsiasi Cosa LoRA in modo da poter aggiungere, rimuovere, sostituire o restylare elementi in un clip mantenendo intatto il ritmo della scena.
Riconoscimenti#
Questo flusso di lavoro implementa e si basa sui seguenti lavori e risorse. Ringraziamo LTX per il LTX 2.3 Modifica Qualsiasi Cosa Workflow Source per i loro contributi e la manutenzione. Per dettagli autorevoli, si prega di fare riferimento alla documentazione originale e ai repository collegati di seguito.
Risorse#
- LTX/LTX 2.3 Modifica Qualsiasi Cosa Workflow Source
- Docs / Note di Rilascio @Benji’s AI Playground: LTX 2.3 Modifica Qualsiasi Cosa Workflow Source
Nota: L'uso dei modelli, dataset e codice di riferimento è soggetto alle rispettive licenze e termini forniti dai loro autori e manutentori.


