LTX 2.3 Outpainting per ComfyUI: Espansione senza soluzione di continuità del fotogramma video con coerenza temporale#
Questo flusso di lavoro implementa LTX 2.3 Outpainting per estendere i fotogrammi video oltre i loro confini originali preservando il movimento, l'illuminazione e la prospettiva. È progettato per editor e creatori che necessitano di cambiamenti nel rapporto di aspetto, estensioni laterali o verticali, e riformulazioni cinematografiche senza interrompere la continuità. Utilizzando la guida IC‑LoRA, LTX 2.3 Outpainting riempie le regioni della tela mascherate in modo coerente nel tempo e può anche generare audio sincronizzato.
Basato sul modello Lightricks’ LTX‑2.3 e sulla sua integrazione ComfyUI, il grafico accoppia un preprocessore di outpaint intelligente con il condizionamento IC‑LoRA per guidare la generazione nelle aree appena aggiunte. Puoi eseguire varianti pure text‑to‑video o image‑to‑video, visualizzare in anteprima i fotogrammi di controllo ed esportare un MP4 finale con audio.
Modelli chiave nel flusso di lavoro Comfyui LTX 2.3 Outpainting#
- Checkpoint LTX‑2.3 22B. Modello di diffusione audio‑video core che guida la qualità della generazione e la stabilità temporale. Usa i pesi ufficiali LTX‑2.3 come ltx‑2.3‑22b‑dev o ltx‑2.3‑22b‑distilled‑1.1 per esecuzioni più veloci Pagina di Hugging Face e i dettagli del modello a monte nel repository LTX‑Video GitHub e nel paper arXiv.
- Encoder di testo Gemma 3 12B Instruct con proiezione di testo LTX 2.3. Codifica i prompt con forte aderenza, alimentando LTX‑2.3 attraverso la configurazione a doppio encoder di ComfyUI. Vedi la scheda encoder Hugging Face e supporto ComfyUI GitHub.
- Video VAE e audio VAE LTX‑2.3. Mappa tra lo spazio dei pixel o delle forme d'onda e lo spazio latente del modello per decodificare i fotogrammi finali e l'audio. Distribuito nel pacchetto ComfyUI‑LTXVideo GitHub.
- LTX 2.3 Outpainting IC‑LoRA. Una espansione spaziale LoRA che condiziona LTX‑2.3 a trattare le regioni mascherate o nere come aree di generazione, preservando la continuità della scena nel tempo. Sfrutta il condizionamento IC‑LoRA fornito dai nodi LTXVideo GitHub.
- Preprocessore di outpaint video. Il nodo di outpaint in stile VACE calcola la nuova tela, maschera e fotogrammi di controllo utilizzati da LTX 2.3 Outpainting per guidare la sintesi nelle regioni espanse GitHub.
Come utilizzare il flusso di lavoro Comfyui LTX 2.3 Outpainting#
Il flusso di lavoro ha cinque gruppi coordinati. VACE OUTPAINT propone la nuova tela e maschera, LTX 2.3 Preprocess prepara gli input, SAMPLING sintetizza video e audio, e la fase di output codifica l'MP4 finale. PROMPTING e MODELS funzionano in parallelo per fornire il condizionamento del testo e i pesi.
MODELS#
Questo gruppo carica il checkpoint base LTX‑2.3 e applica LTX 2.3 Outpainting IC‑LoRA affinché il modello impari dove aggiungere nuovi contenuti. I video e gli audio VAE sono inizializzati per decodificare fotogrammi e forme d'onda. Lo stato del modello viene passato a valle al guidatore e al campionatore in modo che gli stessi pesi guidino sia il condizionamento che la denoising. Non è necessario modificare nulla qui a meno che tu non voglia scambiare il checkpoint base o un diverso IC‑LoRA.
PROMPTING#
I prompt positivi e negativi sono codificati da una configurazione a doppio encoder, accoppiando Gemma 3 12B con la proiezione di testo LTX 2.3. Scrivi ciò che vuoi vedere nei margini aggiunti insieme a indizi di movimento e direzione della luce per allineare il contenuto outpainted. Lo stile o il contenuto che non vuoi va nel prompt negativo. Gli encoder producono flussi di condizionamento che vengono successivamente fusi con la guida LTX 2.3 Outpainting.
VACE OUTPAINT#
Carica un video sorgente nel caricatore per generare immagini per fotogramma. Il nodo VACEOutpaint (#5109) calcola una tela espansa e una maschera precisa che segna la nuova area di generazione. Il grafico compone i fotogrammi originali in questa tela più grande con ImageCompositeMasked (#5110), risultando in fotogrammi di controllo che mostrano chiaramente le regioni "mantieni" rispetto a "sintetizza". Un ramo di anteprima assembla questi fotogrammi di controllo in un MP4 leggero in modo da poter confermare la geometria outpaint prima di generare. Larghezza, altezza e lunghezza della sequenza di questa fase guidano l'impostazione latente a valle, in modo che il modello funzioni alla dimensione esatta espansa.
LTX 2.3 Preprocess#
I fotogrammi compositi sono normalizzati per LTX‑2.3 con LTXVPreprocess (#3336). Se vuoi l'ancoraggio immagine-a-video, imposta bypass_i2v su false in modo che LTXVImgToVideoConditionOnly (#3159) condizioni il movimento sui fotogrammi di controllo; per l'outpainting puro text‑to‑video impostalo su true. LTXVConditioning (#1241) collega il condizionamento del prompt ed eredita il frame rate dal caricatore video, mantenendo audio e video sincronizzati. Questi segnali fluiscono in LTXAddVideoICLoRAGuide per informare dove e come LTX 2.3 Outpainting dovrebbe riempire le aree mascherate.
SAMPLING#
LTXAddVideoICLoRAGuide (#5012) fonde prompt, condizionamento opzionale dell'immagine, l'immagine di controllo outpainted e l'IC‑LoRA in un unico pacchetto di guida. Un latente audio vuoto con il conteggio corretto dei fotogrammi è concatenato in modo che l'audio sia generato in sincronia con il video. Il campionatore utilizza CFGGuider (#4828) con un denoiser selezionato da KSamplerSelect e una breve pianificazione ManualSigmas per bilanciare l'aderenza al prompt e la fluidità temporale. SamplerCustomAdvanced (#4829) produce un latente audio‑video congiunto che viene poi suddiviso per la decodifica.
Decode and export#
VAEDecodeTiled (#4851) decodifica i fotogrammi video in modo efficiente alla risoluzione espansa, e LTXVAudioVAEDecode (#4848) ricostruisce la forma d'onda. VHS_VideoCombine (#5137) combina fotogrammi e audio in un MP4 e lo scrive nella cartella di output al frame rate ereditato. Un ramo di anteprima separato assembla il video di controllo VACE per una rapida iterazione prima delle esecuzioni finali.
Nodi chiave nel flusso di lavoro Comfyui LTX 2.3 Outpainting#
VACEOutpaint (#5109)#
Calcola la tela di destinazione e una maschera binaria o sfumata che segna le regioni outpaint. Espandi a sinistra o a destra per riformulare in widescreen o in alto e in basso per conversioni verticali, poi conferma nel video di anteprima. Mantieni la crescita moderata al primo passaggio, iterare se hai bisogno di più spazio. Le regioni nere o chiaramente mascherate funzionano meglio perché LTX 2.3 Outpainting è addestrato a trattarle come zone di generazione.
LTXAddVideoICLoRAGuide (#5012)#
Centrale per LTX 2.3 Outpainting, questo nodo inietta l'IC‑LoRA e utilizza i fotogrammi di controllo compositi per indirizzare la generazione solo nelle aree mascherate. Aumenta la forza del LoRA per imporre un comportamento di espansione spaziale più forte, riducila se il modello inizia a sovrascrivere il contenuto originale. Il fattore di downscale latente proviene dal caricatore e dovrebbe essere lasciato così com'è, a meno che tu non stia bilanciando velocità e dettaglio.
CFGGuider (#4828)#
Controlla quanto strettamente il modello segue i tuoi prompt rispetto al condizionamento dell'input. Aumenta la guida per affinare l'aderenza nei margini appena aggiunti, abbassala se il movimento diventa instabile. Considera modifiche minori insieme al programma sigma piuttosto che salti grandi.
SamplerCustomAdvanced (#4829) con KSamplerSelect e ManualSigmas (#5025)#
Definisce il percorso di denoising. La variante Euler Ancestral CFG++ scelta fornisce dettagli nitidi con movimento fluido per LTX‑2.3. Una breve scala sigma manuale aiuta a preservare la struttura del fotogramma originale mentre consente alle zone outpainted di evolversi coerentemente.
VAEDecodeTiled (#4851)#
Decodifica fotogrammi ad alta risoluzione in piastrelle per gestire la VRAM. Se vedi artefatti di cucitura, regola leggermente la dimensione delle piastrelle o la sovrapposizione e riesegui. Questo nodo è puramente per efficienza e non cambia l'esito creativo.
VHS_VideoCombine (#5137)#
Combina fotogrammi video e la traccia audio generata al frame rate ereditato. Se preferisci l'audio di origine, instrada quell'audio nel combinatore e disabilita la traccia generata.
Extra opzionali#
- Consigli sui prompt per LTX 2.3 Outpainting: descrivi il contenuto che dovrebbe apparire specificamente nei nuovi margini, aggiungi verbi di movimento, direzione della telecamera e indizi di illuminazione. Mantieni i prompt negativi brevi e concentrati sugli artefatti visivi che vuoi sopprimere.
- Geometria outpaint: inizia con piccoli pad laterali per un aspetto naturale, poi iterare verso il rapporto di aspetto finale. Le maschere sfumate si fondono meglio dei bordi duri quando si estendono cieli, acqua o fogliame.
- Text‑to‑video vs image‑to‑video: imposta
bypass_i2vsutrueper LTX 2.3 Outpainting guidato dal testo,falsequando vuoi che il fotogramma originale ancora lo stile e il layout. - Riferimenti e fonti: pesi LTX‑2.3 e integrazione ComfyUI GitHub e Hugging Face; preprocessore di outpaint in stile VACE GitHub.
Ringraziamenti#
Questo flusso di lavoro implementa e si basa sui seguenti lavori e risorse. Ringraziamo @CG Pixel il creatore di LTX 2.3 per il flusso di lavoro Outpainting per i loro contributi e manutenzione. Per dettagli autorevoli, si prega di fare riferimento alla documentazione originale e ai repository collegati di seguito.
Risorse#
- Fonte del flusso di lavoro LTX 2.3/Outpainting
- Documenti / Note di rilascio: YouTube @CG Pixel
Nota: L'uso dei modelli, dei set di dati e del codice di riferimento è soggetto alle rispettive licenze e ai termini forniti dai loro autori e manutentori.

