LTX 2.3 Cozy Felt Text-to-Video Workflow per ComfyUI#
Questo workflow trasforma brevi prompt in clip di movimento stilizzati in un'estetica di ritagli di feltro fatti a mano. Costruito attorno allo stile Cozy Felt di VRGameDevGirl84 per LTX 2.3, spinge le composizioni verso bordi morbidi, cuciture e texture morbide mantenendo la coerenza temporale per il video. LTX 2.3 Cozy Felt è ideale per i creatori che desiderano una pipeline di testo in video pronta e affidabile che esporta MP4 con audio sincronizzato generato dal modello.
A differenza di un modello generico, LTX 2.3 Cozy Felt è cablato per un prompting veloce, selezione LoRA con un clic, gestione robusta del video e audio VAE LTX e un percorso di esportazione pulito. Aggiungi la parola trigger Cozy Felt al tuo prompt, scegli il LoRA, imposta la lunghezza del clip e il frame rate, e rendi. Il grafico utilizza un campionatore a due stadi con un passaggio di upsampling per bilanciare la forza dello stile con dettaglio e stabilità.
Modelli chiave nel workflow Comfyui LTX 2.3 Cozy Felt#
- LTX-2.3 22B Distilled 1.1: la dorsale di diffusione che genera i latenti video e audio dal condizionamento del testo. Fonte: Lightricks/LTX-2.
- LTX 2.3 Cozy Felt Style LoRA: l'adattatore di stile di VRGameDevGirl84 che indirizza il modello base verso un look di feltro accogliente, carta cucita. Fonte: vrgamedevgirl84/LTX2.3_Cozy_Felt_Style_LoRa.
- LTX Video VAE: il decodificatore spaziotemporale che ricostruisce i frame dai latenti video. Pesi curati: Kijai/LTXV2_comfy.
- LTX Audio VAE: il decodificatore che ricostruisce la traccia audio sincronizzata dai latenti audio. Pesi curati: Kijai/LTXV2_comfy.
- LTX AV Text Encoder (Gemma 3 12B IT) e connettore di embedding LTX: mappa i prompt nel condizionamento compatibile con l'architettura LTX 2.3. Riferimento: Lightricks/LTX-2.
- LTX Spatial Upscaler x2: un upscaler latente per dettagli più puliti prima della decodifica finale. Fonte: Lightricks/LTX-2.
Come utilizzare il workflow Comfyui LTX 2.3 Cozy Felt#
In sintesi: carichi i modelli LTX 2.3, scegli il LTX 2.3 Cozy Felt LoRA, scrivi un prompt che includa il trigger, imposta la durata del clip e il frame rate, quindi rendi ed esporta. Il grafico esegue un campionatore a due stadi con un upsample a metà passaggio, decodifica video e audio, quindi muxa tutto in MP4.
Carica Modelli#
Questo gruppo inizializza tutte le risorse LTX core in modo che il resto del grafico possa concentrarsi su prompting e campionamento. Il UNETLoader (#5288) carica la dorsale LTX-2.3 22B Distilled, mentre LTXAVTextEncoderLoader (#5289) porta nel codificatore di testo AV e il suo connettore di embedding. VAELoaderKJ (#5287) e LTXVAudioVAELoader (#5291) preparano i VAE video e audio, e LatentUpscaleModelLoader (#5286) prepara l'upscaler x2 per il raffinement a metà passaggio. Nessuna modifica è richiesta qui una volta che i pesi sono in posizione.
LoRA#
Il LoraLoaderModelOnly (#5230) applica l'adattatore VRGameDevGirl84 LTX 2.3 Cozy Felt al modello base. Usa il menu a discesa lora_name per selezionare il file Cozy Felt e regola strength_model se desideri un accenno sottile o un look completo di ritaglio di feltro. Poiché questo è un loader solo per modelli, mantiene intatto il resto dello stack LTX mentre inietta lo stile. Se in seguito provi altri LoRA LTX 2.3, cambia la selezione e mantieni il resto del grafico invariato. Fonte LoRA: vrgamedevgirl84/LTX2.3_Cozy_Felt_Style_LoRa.
Prompts#
Due codificatori modellano il condizionamento del testo. Il principale CLIPTextEncode (#5223) è dove scrivi il tuo prompt di scena e aggiungi la parola trigger Cozy Felt F3ltCut0u7 per spingere lo stile LTX 2.3 Cozy Felt. Un secondo CLIPTextEncode (#5259) trasporta negativi che riducono artefatti fotorealistici e superfici plastiche lucide in modo che la texture del feltro rimanga dominante. Usa frasi compatte, orientate agli oggetti con suggerimenti materiali come cuciture, fibre di feltro fuzzy e ritagli stratificati. Evita parole di stile contrastanti se desideri un output più forte di LTX 2.3 Cozy Felt.
Dimensione Video#
EmptyImage (#5217) imposta la larghezza e altezza di lavoro per il latente video. Le dimensioni qui decidono il rapporto d'aspetto per l'intero clip e passano informazioni sulla forma più in profondità nel campionatore. Scegli una dimensione che corrisponda alla tua destinazione di consegna per evitare bande nere in post-produzione. L'upscaling è gestito più tardi nello spazio latente, quindi puoi iniziare snello e raffinare a metà passaggio.
Calcolo Frame Rate + Lunghezza#
Questo gruppo calcola il conteggio totale dei frame dalle tue scelte di temporizzazione. Imposta la durata del clip con seconds in PrimitiveInt (#5295) e il frame_rate desiderato con Float (#5296). ComfyMathExpression (#5293) moltiplica questi valori per produrre length, e JWFloatToInteger (#5298) assicura che i nodi dipendenti dalla temporizzazione ricevano interi. Mantieni seconds × frame_rate allineato con le tue impostazioni di esportazione per un movimento fluido senza frame persi o duplicati.
Render#
Il sottografo Samplers (Samplers (#5232)) esegue un processo di diffusione a due stadi su misura per LTX 2.3 Cozy Felt. LTXVConditioning (#5224) alimenta il condizionamento positivo e negativo insieme al frame_rate in modo che i segnali temporali rimangano coerenti durante l'esecuzione. Il grafico crea latenti video e audio della stessa lunghezza, li combina e li instrada attraverso due campionatori separati da un upsample latente. Il risultato è una sequenza stilizzata e coerente che già trasporta un letto audio derivato dallo stesso prompt.
Preprocess#
All'interno del sottografo del campionatore, ImageScaleBy e GetImageSize preparano i dati di forma di riferimento, mentre RandomNoise semina l'esecuzione per la riproducibilità. EmptyLTXVLatentVideo (#5163) e LTXVEmptyLatentAudio (#5170) creano latenti AV sincronizzati basati su length e frame_rate. Questi sono concatenati tramite LTXVConcatAVLatent in modo che video e audio rimangano allineati durante la denoising. Cambiare il seme è il modo più veloce per esplorare più variazioni di LTX 2.3 Cozy Felt dallo stesso prompt.
Stadio Campionatore 1#
SamplerCustomAdvanced (#5159) esegue il passaggio di denoising iniziale utilizzando un programma da ManualSigmas (#5182) e la guida di CFGGuider (#5151). Questo stadio stabilisce la composizione globale, indizi di movimento e la texture di feltro principale suggerita dal tuo trigger e parole materiali. L'output è diviso in video e audio con LTXVSeparateAVLatent (#5167), quindi il latente video è raffinato da LTXVLatentUpsampler (#5187) utilizzando l'upscaler x2. Il video upscalato viene riunito con il latente audio per mantenere la sincronizzazione prima del prossimo campionatore.
Stadio Campionatore 2#
SamplerCustomAdvanced (#5155) applica un programma di raffinamento più breve da ManualSigmas (#5183) guidato da CFGGuider (#5171). Questo stadio affina i bordi, le cuciture e i confini di ritagli stratificati che definiscono l'aspetto LTX 2.3 Cozy Felt senza deviare dallo stile. Dopo il denoising, LTXVSeparateAVLatent (#5156) divide il risultato per la decodifica. Mantieni lo stesso frame_rate attraverso il condizionamento e l'esportazione per preservare la temporizzazione.
Decodifica ed Esporta#
LTXVSpatioTemporalTiledVAEDecode (#5185) ricostruisce i frame video dal latente video finale, e LTXVAudioVAEDecode (#5169) ricostruisce l'audio. Al livello superiore, VHS_VideoCombine (#5265) muxa immagini e audio in un MP4, rispettando il frame_rate scelto e salvando un file adatto per l'anteprima. I nomi dei file sono gestiti automaticamente in modo da poter iterare rapidamente e confrontare i risultati. Questo rende semplice produrre più take di un singolo prompt LTX 2.3 Cozy Felt.
Nodi chiave nel workflow Comfyui LTX 2.3 Cozy Felt#
LoraLoaderModelOnly (#5230)#
Applica l'adattatore VRGameDevGirl84 LTX 2.3 Cozy Felt al UNet senza toccare codificatori o VAE. Regola strength_model per bilanciare tra Cozy Felt puro e un accenno più leggero quando si mescolano con altri suggerimenti estetici. Se passi a un diverso LoRA LTX 2.3, usa questo stesso nodo per scambiare i file.
LTXVConditioning (#5224)#
Collega il condizionamento positivo e negativo nel formato AV LTX mentre passa frame_rate in modo che le embedding temporali corrispondano alla tua esportazione. Mantieni la stessa impostazione di frame_rate attraverso il grafico per una cadenza di movimento coerente.
ManualSigmas (#5182) e ManualSigmas (#5183)#
Definisci i programmi di rumore per i due stadi del campionatore. Il primo programma è più ampio per struttura e movimento, il secondo è più stretto per dettaglio e texture. Se introduci un nuovo programma, testa piccoli cambiamenti per evitare di destabilizzare i bordi di feltro o causare sfarfallii.
LTXVLatentUpsampler (#5187)#
Esegue l'upscaling dei latenti video tra gli stadi del campionatore utilizzando il modello x2 di LTX. Questo migliora la definizione dei bordi e i contorni di carta stratificata tipici di LTX 2.3 Cozy Felt mantenendo efficiente il calcolo rispetto all'upscaling nello spazio immagine. Pesi di riferimento: Lightricks/LTX-2.
LTXVSpatioTemporalTiledVAEDecode (#5185)#
Decodifica video con una strategia a piastrelle per adattarsi alla memoria preservando il contesto temporale. Se incontri limiti di memoria, regola le sue opzioni di piastrellatura invece di ridurre la tua risoluzione di lavoro. Implementazione fornita da KJNodes: Kijai/ComfyUI-KJNodes.
VHS_VideoCombine (#5265)#
Assembla frame decodificati e audio in un unico MP4. Ottimizza i suoi controlli di format e qualità per soddisfare le tue esigenze di consegna. Mantenere frame_rate allineato con i gruppi precedenti evita disallineamenti temporali.
Extra opzionali#
- Prompting per LTX 2.3 Cozy Felt: includi il trigger F3ltCut0u7 oltre a suggerimenti materiali come cuciture, fibre di feltro fuzzy, ritagli stratificati e illuminazione a lanterna morbida.
- Mantieni i negativi concisi per evitare plastica lucida, fotorealismo e suggerimenti CGI che possono sovrastare la texture del feltro.
- Per variazioni rapide, cambia il seme mantenendo lo stesso prompt e temporizzazione; per cambiamenti maggiori, regola leggermente la frase del soggetto o gli aggettivi materiali.
- I clip più lunghi beneficiano di un linguaggio di telecamera stabile nel prompt e meno azioni concorrenti.
- Se provi altri LoRA LTX 2.3, rimuovi il trigger Cozy Felt e usa il nuovo trigger dell'adattatore per i migliori risultati. Per ulteriori LoRA LTX 2.3, vedi la collezione: vrgamedevgirl84/ltx-23-loras.
Ringraziamenti#
Questo workflow implementa e si basa sui seguenti lavori e risorse. Ringraziamo con gratitudine Purz per LTX 2.3 - Cozy Felt (ComfyUI workflow), VRGameDevGirl84 per la collezione LTX 2.3 LoRA, e VRGameDevGirl84 per LTX2.3_Cozy_Felt_Style_LoRa per i loro contributi e manutenzione. Per dettagli autorevoli, fare riferimento alla documentazione e ai repository originali collegati di seguito.
Risorse#
- Purz/LTX 2.3 - Cozy Felt (ComfyUI Workflow)
- Documenti / Note di rilascio: LTX 2.3 - Cozy Felt — ComfyUI Workflow
- VRGameDevGirl84/LTX 2.3 LoRA collection
- Hugging Face: LTX 2.3 LoRAs
- VRGameDevGirl84/LTX2.3_Cozy_Felt_Style_LoRa
- GitHub: vrgamegirl19/comfyui-vrgamedevgirl
- Hugging Face: vrgamedevgirl84/LTX2.3_Cozy_Felt_Style_LoRa
- VRGameDevGirl84/Hugging Face profile
- Hugging Face: vrgamedevgirl84
Nota: L'uso dei modelli, dei set di dati e del codice di riferimento è soggetto alle rispettive licenze e termini forniti dai loro autori e manutentori.
