LTX 2.3 MSR 多主題身分影片工作流程在 ComfyUI 中#
此工作流程使用 LTX 2.3 MSR 將多個角色或物體參考轉換為單一、一致的、可用於故事的影片。它在多個主題中保留身分,同時利用 LTX‑2.3 視聽模型進行動作、攝影和同步聲音。創作者可以結合最多四個主題圖像加上一個背景,然後使用提示來指導場景中的對話、群體鏡頭和動態生活方式序列。
為講故事者、廣告商和社交創作者而設計,該圖表將參考組合成一個 MSR 指南,通過圖像條件的 LoRA 傳遞注入身分,並取樣一個視聽潛在變量,解碼為幀和可選音頻。LTX 2.3 MSR 是身分保真度的錨點;其餘管道處理構圖、運動引導和導出。
Comfyui LTX 2.3 MSR 工作流程中的關鍵模型#
- LTX‑2.3 22B distilled (1.1) 由 Lightricks 提供。生成運動、視覺和同步音頻的基礎視聽模型。權重已在 Hugging Face 上發布,位於 LTX‑2.3。 Lightricks/LTX-2.3
- Gemma 3 12B Instruct 文本編碼器 (fp4 mixed)。用於 LTX 堆棧中的提示編碼,將文本轉換為生成的條件信號。隨 LTX 資產打包於 ComfyUI 中。 Comfy-Org/ltx-2
- LTX 2.3 MSR LoRA (Licon MSR V1)。LTX‑2.3 專用的多主題參考 LoRA,同時鎖定多個身分,穩定整個片段中的面孔、服裝和物體特徵。 liconstudio/ComfyUI-Licon-MSR
- LTX‑2 Audio VAE。提供生成或附加同步聲音時使用的潛在音頻空間和解碼。 Comfy-Org/ltx-2
如何使用 Comfyui LTX 2.3 MSR 工作流程#
此圖表有三個階段:從參考中建立 MSR 指南,用多圖像引導和提示來調節影片潛在變量,然後取樣並解碼為幀和音頻。
- Comfig
- 在配置節點中設置您的畫布
width、height、總frames和fps。這些將供應空的影片和音頻潛在變量以及導出階段,保持從條件到最終渲染的時間一致性。 - 選擇適合您的故事的長寬比和時長。更高的幀數增加了運動連續性,但也增加了 VRAM 和運行時間。
- 在配置節點中設置您的畫布
- Reference loaders
- 加載最多四個主題圖像 (
img1,img2,img3,img4) 和一個背景 (bg)。這些映射到refimg1..4和refbg獲取器,以便您可以快速更換源而無需重新接線。 - 使用清晰、光線充足的圖像,主題居中且無遮擋。對於您希望保留的服裝或道具,確保它們至少在一個參考中可見。
- 加載最多四個主題圖像 (
- MSR composer
LiconMSR(#28) 將主題參考和背景組合成單一 MSR 圖像輸出。這成為 LTX 2.3 MSR 的視覺身分藍圖,在取樣之前對齊面部特徵、服裝和物體細節。- 一個小的
VHS_VideoCombine(#66) 從 MSR 輸出創建一個快速低 FPS 預覽,以便您在運行完整渲染之前檢查構圖。
- Multi‑guide conditioning
LTXVAddGuideMulti(#108) 吞入最多五張圖像(您的四個主題加背景)以及正面和負面提示,以產生具有空間和外觀引導的初始影片潛在變量。- 正面提示文本描述場景、攝影機和氛圍;負面文本避免工件和非風格化外觀。
LTXVConditioning(#7) 附加您的fps,以便運動時間與導出器匹配。
- LoRA identity control
- LTX 2.3 MSR LoRA 加載到模型中,並使用
LTXAddVideoICLoRAGuide(#9) 應用圖像條件的 LoRA 傳遞,使用 MSR 圖像。這在幀間加強身分而不凍結運動。 - 使用此階段平衡身分強度與自然運動和表達的自由。
- LTX 2.3 MSR LoRA 加載到模型中,並使用
- Sampling
- 取樣器堆棧使用
CFGGuider(#37)、KSamplerSelect(#13)、ManualSigmas(#27) 和RandomNoise(#15),餵給SamplerCustomAdvanced(#16)。結果是一個反映您的參考、提示和 MSR 限制的聯合視聽潛在變量。 - 如果您需要新的變化,請更改噪聲種子或取樣器,同時保持參考和 MSR 設置不變以保持一致性。
- 取樣器堆棧使用
- Crop guidance and decode
LTXVCropGuides(#17) 將影片潛在變量調整為目標幀大小,避免不必要的修剪。然後影片和音頻潛在變量由LTXVSeparateAVLatent(#24) 分開。VAEDecode(#38) 將影片潛在變量轉換為幀;LTXVAudioVAEDecode(#25) 重建音頻。
- Export
VHS_VideoCombine(#96) 將幀和可選音頻組合成 H.264 MP4,使用您選擇的fps和filename_prefix。這是 LTX 2.3 MSR 工作流程生成的最終影片。
Comfyui LTX 2.3 MSR 工作流程中的關鍵節點#
LiconMSR (#28)#
將 1–4 個主題參考加上一個背景組合成一個 MSR 指南。設置 width 和 height 以匹配您的目標畫布,以便組成的指南和最終幀對齊。如果您看到身分漂移,請重新檢查輸入參考或增加關鍵主題在其源圖像中的顯著性。
LTXVAddGuideMulti (#108)#
將多個引導圖像與您的提示結合形成初始影片潛在變量。使用它來優先考慮哪些參考主導場景,通過稍微偏愛主要主題來實現。保持背景引導活躍,以保持穩定的環境和較少的場景跳躍。
LTXAddVideoICLoRAGuide (#9)#
使用組成的 MSR 圖像注入圖像條件的 MSR LoRA。增加 strength 以加強對面孔、服裝或道具的身分保留;如果運動感太受限制,則減少它。裁剪選擇應反映主題最常出現的位置。
CFGGuider (#37)#
控制取樣器遵循您的提示的強度。較高的 cfg 提高了對文本意圖的遵循,但可能減少變化;中等值保持自然外觀,同時尊重 MSR 引導。
SamplerCustomAdvanced (#16)#
使用您選擇的取樣器、sigma 和噪聲種子運行去噪過程。Euler 或 DPM 風格的取樣器與 LTX‑2.3 配合良好;探索種子以尋找替代品,同時保持相同的參考以保留身分。
VHS_VideoCombine (#96)#
構建最終的 MP4,並可選音頻。將 frame_rate 與條件階段匹配,並設置清晰的 filename_prefix 以便版本控制。使用此節點的預覽來檢查節奏和身分一致性,然後再分享。
可選擇的額外功能#
- 準備參考時,使用中性、正面角度和最小遮擋;對於複雜的髮型或配件,添加第二個角度。
- 保持衣櫥和道具參考足夠大,以便紋理和標誌可見;避免在源圖像中出現嚴重的運動模糊。
- 當身分完美但運動僵硬時,稍微降低 LTX 2.3 MSR 階段中 LoRA 引導的強度,並添加提示來提示運動。
- 對於較長的故事,增加
frames並保持fps不變以保留時間;對於更快的編輯,提高fps並縮短frames。 - 使用光線和視角類似於您預期場景的背景參考,以減少不一致。
致謝#
此工作流程實施並建立在以下作品和資源之上。我們感謝 LTX 項目對 LTX 2.3 MSR (多主題參考) 工作流程的貢獻和維護。欲了解權威細節,請參考下列連結的原始文檔和存儲庫。
資源#
- LTX/LTX 2.3 MSR 工作流程來源
- 文檔/發佈說明:RunningHub post
注意:所引用的模型、數據集和代碼的使用受其作者和維護者提供的相應許可和條款的約束。

