LTX 2.3 Cozy Felt Text-to-Video Workflow for ComfyUI#
這個工作流程將短提示轉換為具有手工毛氈剪紙美學的風格化動態片段。基於 VRGameDevGirl84 的 Cozy Felt 風格 LoRA 為 LTX 2.3 打造,推動構圖朝向柔和邊緣、縫合線和豐滿質感,同時保持影片的時間一致性。LTX 2.3 Cozy Felt 是想要一個準備就緒且可靠的文字轉影片管道的創作者的理想選擇,可匯出具有同步、模型生成音頻的 MP4。
與一般模板不同,LTX 2.3 Cozy Felt 專為快速提示、一鍵 LoRA 選擇、強大的 LTX 影片和音頻 VAE 處理以及乾淨的匯出路徑而設計。將 Cozy Felt 觸發單詞添加到您的提示中,選擇 LoRA,設置片段長度和幀率,然後渲染。圖表使用兩階段取樣器,配合上採樣步驟來平衡風格強度與細節穩定性。
Comfyui LTX 2.3 Cozy Felt 工作流程中的關鍵模型#
- LTX-2.3 22B Distilled 1.1:從文字條件生成影片和音頻潛在變量的擴散骨幹。來源:Lightricks/LTX-2。
- LTX 2.3 Cozy Felt Style LoRA:VRGameDevGirl84 的風格適配器,將基礎模型引導至溫馨毛氈、縫合紙外觀。來源:vrgamedevgirl84/LTX2.3_Cozy_Felt_Style_LoRa。
- LTX Video VAE:重建影片潛在變量的時空解碼器。精選權重:Kijai/LTXV2_comfy。
- LTX Audio VAE:從音頻潛在變量重建同步音軌的解碼器。精選權重:Kijai/LTXV2_comfy。
- LTX AV Text Encoder (Gemma 3 12B IT) 和 LTX 嵌入連接器:將提示映射到與 LTX 2.3 架構兼容的條件。參考:Lightricks/LTX-2。
- LTX Spatial Upscaler x2:最終解碼前的潛在變量升頻器。來源:Lightricks/LTX-2。
如何使用 Comfyui LTX 2.3 Cozy Felt 工作流程#
一目了然:加載 LTX 2.3 模型,選擇 LTX 2.3 Cozy Felt LoRA,撰寫包含觸發詞的提示,設置片段持續時間和幀率,然後渲染並匯出。圖表運行兩階段取樣器,配合中途上採樣,解碼影片和音頻,然後將所有內容混合成 MP4。
加載模型#
此組初始化所有核心 LTX 資產,使其餘圖表能專注於提示和取樣。UNETLoader (#5288) 加載 LTX-2.3 22B Distilled 骨幹,LTXAVTextEncoderLoader (#5289) 進入 AV 文本編碼器及其嵌入連接器。VAELoaderKJ (#5287) 和 LTXVAudioVAELoader (#5291) 準備影片和音頻 VAE,LatentUpscaleModelLoader (#5286) 準備中途細化的 x2 升頻器。一旦權重就位,這裡不需要進行編輯。
LoRA#
LoraLoaderModelOnly (#5230) 將 VRGameDevGirl84 LTX 2.3 Cozy Felt 適配器應用於基礎模型。使用 lora_name 下拉選單選擇 Cozy Felt 文件,並調整 strength_model 以獲得微妙的提示或完整的毛氈剪紙外觀。由於這是模型專用加載器,它保持其餘 LTX 堆棧完整,同時注入風格。如果您稍後嘗試其他 LTX 2.3 LoRA,切換選擇並保持其餘圖表不變。來源 LoRA:vrgamedevgirl84/LTX2.3_Cozy_Felt_Style_LoRa。
提示#
兩個編碼器塑造文本條件。主要的 CLIPTextEncode (#5223) 是撰寫場景提示並添加 Cozy Felt 觸發詞 F3ltCut0u7 以推動 LTX 2.3 Cozy Felt 風格的地方。次要的 CLIPTextEncode (#5259) 攜帶負面條件,以減少照片真實的工藝品和光滑的塑料表面,讓毛氈質感保持主導地位。使用緊湊、物件優先的措辭,並以縫合線、毛絨纖維和分層剪紙等材料提示。若想要更強的 LTX 2.3 Cozy Felt 輸出,請避免使用衝突的風格詞語。
影片尺寸#
EmptyImage (#5217) 設置影片潛在變量的工作寬度和高度。此處的尺寸決定整個片段的縱橫比,並將形狀信息傳遞到更深層的取樣器中。選擇與目標交付匹配的尺寸,以避免後期製作中的信箱效果。上採樣稍後在潛在空間中處理,因此您可以從精簡開始,並在中途細化。
幀率與長度計算#
此組根據您的時間選擇計算總幀數。使用 PrimitiveInt (#5295) 設置片段持續時間,以 Float (#5296) 設置所需的 frame_rate。ComfyMathExpression (#5293) 將這些值相乘以產生 length,JWFloatToInteger (#5298) 確保時間依賴的節點獲得整數。保持 seconds × frame_rate 與您的匯出設置對齊,以確保運動流暢,無掉幀或重複幀。
渲染#
Samplers 子圖 (Samplers (#5232)) 運行為 LTX 2.3 Cozy Felt 量身定制的兩階段擴散過程。LTXVConditioning (#5224) 提供正面和負面條件以及 frame_rate,以便時間信號在整個運行過程中保持一致。圖表創建具有相同長度的影片和音頻潛在變量,將它們結合,並通過兩個由潛在上採樣分隔的取樣器路由。結果是風格化且一致的序列,已經攜帶來自相同提示的音頻背景。
預處理#
在取樣器子圖中,ImageScaleBy 和 GetImageSize 準備參考形狀數據,而 RandomNoise 種子運行以確保可重現性。EmptyLTXVLatentVideo (#5163) 和 LTXVEmptyLatentAudio (#5170) 根據 length 和 frame_rate 創建同步的 AV 潛在變量。這些通過 LTXVConcatAVLatent 連接,以便在去噪期間影片和音頻保持對齊。更改種子是從相同提示中探索多種 LTX 2.3 Cozy Felt 變化的最快方式。
取樣器階段 1#
SamplerCustomAdvanced (#5159) 使用 ManualSigmas (#5182) 的計劃和 CFGGuider (#5151) 的指導執行初始去噪通道。此階段建立由觸發詞和材料詞語建議的全球構圖、運動線索和核心毛氈質感。輸出分為影片和音頻,使用 LTXVSeparateAVLatent (#5167),然後影片潛在變量通過 LTXVLatentUpsampler (#5187) 使用 x2 上採樣器進行細化。上採樣的影片與音頻潛在變量重新結合,以保持同步,然後進入下一個取樣器。
取樣器階段 2#
SamplerCustomAdvanced (#5155) 使用 ManualSigmas (#5183) 的較短細化計劃,在 CFGGuider (#5171) 的指導下應用。此階段加強 LTX 2.3 Cozy Felt 外觀的邊緣、縫合和分層剪紙邊界,而不偏離風格。去噪後,LTXVSeparateAVLatent (#5156) 分離結果以進行解碼。保持相同的 frame_rate 在條件和匯出中,以保存時間。
解碼與匯出#
LTXVSpatioTemporalTiledVAEDecode (#5185) 使用平鋪策略重建最終影片潛在變量的影片幀,LTXVAudioVAEDecode (#5169) 重建音頻。在最高層級,VHS_VideoCombine (#5265) 將圖像和音頻混合成 MP4,尊重您選擇的 frame_rate 並保存一個預覽友好的文件。文件名自動管理,讓您能快速迭代並比較結果。這使得製作單一 LTX 2.3 Cozy Felt 提示的多個版本變得簡單。
Comfyui LTX 2.3 Cozy Felt 工作流程中的關鍵節點#
LoraLoaderModelOnly (#5230)#
將 VRGameDevGirl84 LTX 2.3 Cozy Felt 適配器應用於 UNet,而不觸及編碼器或 VAE。調整 strength_model 以在純 Cozy Felt 和輕微提示之間取得平衡,當與其他美學提示混合時。如果您切換到不同的 LTX 2.3 LoRA,請使用這個相同的節點來交換文件。
LTXVConditioning (#5224)#
將正面和負面的條件橋接到 LTX AV 格式,同時傳遞 frame_rate,以便時間嵌入與您的匯出匹配。保持相同的 frame_rate 設定在整個圖表中,以保持一致的運動節奏。
ManualSigmas (#5182) 和 ManualSigmas (#5183)#
定義兩個取樣器階段的噪音計劃。第一個計劃更廣泛,用於結構和運動,第二個更緊湊,用於細節和質感。如果您引入新計劃,請測試小變化,以避免不穩定的毛氈邊緣或導致閃爍。
LTXVLatentUpsampler (#5187)#
在取樣器階段之間使用 LTX 的 x2 模型上採樣影片潛在變量。這改善了 LTX 2.3 Cozy Felt 典型的邊緣定義和分層紙張輪廓,同時保持計算效率,相比於圖像空間上採樣。參考權重:Lightricks/LTX-2。
LTXVSpatioTemporalTiledVAEDecode (#5185)#
使用平鋪策略解碼影片,以適應記憶體,同時保持時間上下文。如果您遇到記憶體限制,請調整其平鋪選項,而不是縮小工作解析度。由 KJNodes 提供的實現:Kijai/ComfyUI-KJNodes。
VHS_VideoCombine (#5265)#
將解碼的幀和音頻組裝成單一 MP4。調整其 format 和質量控制,以匹配您的交付需求。保持 frame_rate 與早期組保持一致,以避免時間不匹配。
可選附加功能#
- 為 LTX 2.3 Cozy Felt 提示:包括觸發詞 F3ltCut0u7 加上材料提示,如縫合線、毛氈纖維、分層剪紙和柔和的燈籠照明。
- 保持負面簡潔,以避免光滑的塑料、照片真實和 CGI 提示,這些會壓過毛氈質感。
- 想要快速變化,請更改種子,同時保持相同的提示和時間;想要更大變化,則略微調整主題措辭或材料形容詞。
- 更長的片段受益於提示中的穩定鏡頭語言和較少的競爭動作。
- 如果您嘗試其他 LTX 2.3 LoRA,請移除 Cozy Felt 觸發器,並使用新適配器的觸發器以獲得最佳效果。更多 LTX 2.3 LoRA,請參見合集:vrgamedevgirl84/ltx-23-loras。
致謝#
此工作流程實施並構建於以下作品和資源之上。我們誠摯感謝 Purz 提供的 LTX 2.3 - Cozy Felt (ComfyUI 工作流程)、VRGameDevGirl84 提供的 LTX 2.3 LoRA 集合,以及 VRGameDevGirl84 提供的 LTX2.3_Cozy_Felt_Style_LoRa,感謝他們的貢獻和維護。欲了解權威詳情,請參閱以下鏈接的原始文檔和存儲庫。
資源#
- Purz/LTX 2.3 - Cozy Felt (ComfyUI Workflow)
- 文檔 / 發布說明:LTX 2.3 - Cozy Felt — ComfyUI Workflow
- VRGameDevGirl84/LTX 2.3 LoRA collection
- Hugging Face: LTX 2.3 LoRAs
- VRGameDevGirl84/LTX2.3_Cozy_Felt_Style_LoRa
- GitHub: vrgamegirl19/comfyui-vrgamedevgirl
- Hugging Face: vrgamedevgirl84/LTX2.3_Cozy_Felt_Style_LoRa
- VRGameDevGirl84/Hugging Face profilejson
- Hugging Face: vrgamedevgirl84
注意:使用所引用的模型、數據集和代碼需遵循其作者和維護者提供的相應許可和條款。
