ComfyUI>工作流程>LTX 2.3 導演 | 電影級 AI 視頻創建器

LTX 2.3 導演 | 電影級 AI 視頻創建器

Workflow Name: RunComfy/LTX-2.3-Director
Workflow ID: 0000...1425
此工作流程讓您能以時間軸的精確度構建電影故事。您可以像在專業編輯器中一樣安排圖片、鏡頭移動和音頻於各個場景中。它幫助創建具有 AI 協助的精緻、以故事為驅動的視頻。管理多個場景、提示和轉換於一處。對於故事講述者、電影製作人以及任何有效製作結構化視頻敘事的人來說,這都是理想的選擇。

ComfyUI LTX 2.3 Director 工作流程

LTX 2.3 Director in ComfyUI | Timeline AI Filmmaking Workflow
想要運行這個工作流程嗎?
  • 完全可操作的工作流程
  • 沒有缺失的節點或模型
  • 無需手動設置
  • 具有驚豔的視覺效果

ComfyUI LTX 2.3 Director 範例

LTX 2.3 導演:基於時間軸的 AI 影片製作適用於 ComfyUI#

LTX 2.3 導演是一個電影級、以時間軸為驅動的工作流程,用於創建具有精確創意控制的結構化 AI 視頻。基於 LTX‑2.3 視頻模型構建,它讓您可以通過安排提示、參考圖片、轉場和音樂來指導多場景序列,沿著熟悉的時間軸進行。結果是在 ComfyUI 中提供導演風格的體驗,從開始到結束一致地處理運動連續性、鏡頭構圖和音頻同步。

專為故事講述者、音樂視頻製作者、預告片編輯者及任何構建 AI 影片製作流程的人設計,LTX 2.3 導演將提示工程轉換為完整的製作流程。您可以設置全局基調,使用局部提示細化每個鏡頭,並在提交高質量升級和最終導出之前快速預覽。

Comfyui LTX 2.3 導演工作流程中的關鍵模型#

  • LTX‑2.3 22B (FP8) 視頻生成模型。核心擴散骨幹,將文本和參考轉換為一致的視頻潛在變量。 Model repo
  • LTX‑2.3 Video VAE (bf16)。編碼和解碼視頻幀至緊湊的潛在空間,以便於高效取樣和高保真重建。 Model repo
  • LTX‑2.3 Audio VAE (bf16)。將音頻打包並恢復至聯合 AV 潛在變量,以確保運動和音軌保持同步。 Model repo
  • LTX‑2.3 Spatial Upscaler x2 v1.1。專用的 x2 潛在升頻器,在精細化過程中提高細節和銳度。 Model repo
  • LTX‑2.3 22B Distilled LoRA (384)。可選的 LoRA,改進質量/效率並可改變模型的外觀。 Model card
  • Tiny VAE (taeltx2_3)。輕量級 VAE,用於在升頻過程之前的快速預覽。 Model repo
  • LTX‑2.3 Text Projection (bf16)。官方文本到視頻投影,用於高質量提示條件設置。 Model repo

如何使用 Comfyui LTX 2.3 導演工作流程#

工作流程分為兩個階段運行。階段 #1 在預覽速度下確定構圖、運動和音頻對齊。階段 #2 升頻、重新引導和細化細節以達到最終質量。完成塊解碼、混合音頻並寫入視頻。

模型#

本節準備驅動 LTX 2.3 導演的模型堆疊和文本編碼器。加載 LTX‑2.3 基本模型,並在需要時添加 LoRA 來調整風格或效率。在完整 VAE 確保後期保真度的同時,Tiny VAE 加速預覽。LTX‑2.3 附帶的雙文本組件提供了強大的提示條件設置,無需額外設置。

需要尋找的關鍵節點:CheckpointLoaderSimple (#77), DualCLIPLoader (#84), LoraLoaderModelOnly (#80, #93, #95), VAELoaderKJ (#78, #4, #3), 和 LTX2SamplingPreviewOverride (#79)。

階段 #1#

階段 #1 將您的時間軸轉換為帶有同步音頻的首批視頻。將您的全局基調和每個鏡頭的提示輸入 LTXDirector (#46) 並組裝一系列帶有圖像和持續時間的片段;該節點返回結合的 AV 潛在變量、引導數據和幀率。LTXVConditioning (#5) 和 LTXDirectorGuide (#8) 將這些指導轉化為結構化的指引。一個包含 CFGGuider (#9), BasicScheduler (#11), KSamplerSelect (#29), 和 SamplerCustomAdvanced (#10) 的取樣器堆疊為整個時間軸生成初始 AV 潛在變量。使用此過程驗證場景順序、節奏和廣泛運動,然後再投入計算資源進行升頻。

階段 #2 升頻#

階段 #2 提升分辨率和保真度,同時保留第一遍的意圖。LTXVCropGuides (#55) 對齊不同鏡頭的構圖,然後由 LatentUpscaleModelLoader (#57) 加載的 LTXVLatentUpsampler (#52) 應用 x2 空間升頻器。第二個 LTXDirectorGuide (#58) 在更高細節下重新注入時間軸提示,並且取樣器堆疊 (CFGGuider (#49), BasicScheduler (#54), KSamplerSelect (#53), SamplerCustomAdvanced (#47)) 細化紋理、面部和邊緣。然後將 AV 潛在變量分離以進行最終解碼,同時保留鏈接的音頻和視頻時間。

處理視頻#

完成塊解碼幀和音頻,重建序列並保存結果。LTXVCropGuides (#14) 確保所選長寬比的覆蓋範圍,並且 VAEDecodeTiled (#94) 安全地解碼高分辨率視頻而不耗盡內存。LTXVAudioVAEDecode (#16) 從音頻潛在變量中恢復音軌。CreateVideo (#17) 以您選擇的 fps 組裝幀和音頻,並且 SaveVideo (#30) 寫入最終文件。

Comfyui LTX 2.3 導演工作流程中的關鍵節點#

  • LTXDirector (#46)。LTX 2.3 導演的核心。它接受全局提示、鏡頭片段的時間軸以及可選的每鏡頭局部提示,然後輸出結構化的指引以及同步的 AV 潛在變量。調整全局和局部提示的平衡以控制每個鏡頭如何緊密地遵循其自身描述。對於以剪輯驅動的編輯,保持片段定義清晰;對於流暢的轉場,允許重疊和一致的風格語言。
  • LTXDirectorGuide (#8)。將導演的提示轉化為階段 #1 的可操作指引。在預覽過程中調整其規模和重採樣方法以在速度和保真度之間取得平衡。如果場景看起來太粗糙,增加其影響力;如果過於受限,減少它以便取樣器可以自由發揮。
  • LTXDirectorGuide (#58)。階段 #2 的第二個、更高保真度的指引。用於在升頻後重新確定構圖、鏡頭意圖和風格。與升頻器平衡此節點:更強的指引鎖定構圖,而輕觸讓升頻器強調細節和微紋理。
  • LTXVCropGuides (#55)。在升頻之前正規化構圖並強制遵循長寬比規則。用於在剪輯中穩定地平線、空間和興趣中心。如果角色在幀之間漂移,則在重採樣之前強化這些裁剪指引。
  • LTXVLatentUpsampler (#52)。將 LTX‑2.3 空間升頻器 x2 應用於潛在變量。這是從階段 #1 預覽中恢復清晰細節的主要杠杆。確保選擇的升頻器模型與您的 VAE 配對匹配以避免不匹配的人工痕跡。
  • CFGGuider (#9, #49)。在取樣過程中控制提示遵循程度。較低值通常會產生更平滑的運動和更自然的轉場;較高值強制文本準確性。如果面部或道具漂移,稍微增加指引;如果運動看起來僵硬,則放寬它。
  • BasicScheduler (#11, #54) 和 KSamplerSelect (#29, #53)。定義噪聲計劃和取樣方法。它們共同決定運動的紋理、時間穩定性和渲染時間。如果看到閃爍,嘗試更平滑的計劃或以時間一致性著稱的取樣器;如果結果缺乏細節,測試偏愛銳利的取樣器。
  • SamplerCustomAdvanced (#10, #47)。兩個過程的工作馬去噪器。它結合了您的噪聲種子、計劃、指引和當前潛在變量來生成 AV 潛在變量。在迭代提示時保持種子不變以進行蘋果對蘋果的比較;當您想要新鮮的阻塞或時間時更改種子。
  • VAEDecodeTiled (#94)。使用可配置的瓷磚解碼高分辨率幀。如果注意到接縫,增加重疊;如果達到內存限制,減小瓷磚大小。即使在中等範圍的 GPU 上也使用瓷磚解碼以獲得一致的穩定性。
  • CreateVideo (#17) 和 SaveVideo (#30)。以所選的 fps 組合幀和音頻,並寫入最終容器。保持 fps 與您的時間軸一致,否則您將改變節奏。對於存檔母帶,使用原生階段 #2 大小導出;對於社交平台,您可以在導出過程中調整大小。

可選額外功能#

  • 用清晰的脊椎構建您的時間軸:全局提示中的全局風格,局部提示中的鏡頭特定內容,並在片段之間保持角色/鏡頭名詞一致。
  • 參考圖片錨定外觀和佈局。用於關鍵鏡頭,如建立幀或特寫,然後讓相鄰片段更多地依賴文本以獲得流暢性。
  • 對於音樂視頻,早期添加音頻並迭代種子,直到運動重點落在節拍上;然後鎖定種子並細化提示。
  • 如果轉場感覺跳躍,延長相鄰片段提示以共享風格語言並在剪輯中保持構圖指引相似。
  • LoRA 疊加,但微妙的強度通常效果最好。從謙虛開始,一次只結合幾個,並在短片上測試其交互。
  • 可重現性很重要:當您批准一個外觀時,請記住噪聲種子、取樣器選擇和任何使用的 LoRA。
  • 如果面部在升頻後搖晃,增加階段 #2 LTXDirectorGuide (#58) 中的指引影響力,或切換到偏愛時間穩定性的計劃。
  • 通過社區策展列表探索額外的 LTX‑2.3 資源和模型。 awesome‑ltx2 on GitHub

使用 LTX 2.3 導演,您可以以一種對時間軸編輯器如 Premiere 或 After Effects 感到熟悉的方式指導複雜的多場景視頻,同時保留 ComfyUI 節點圖的靈活性。在階段 #1 形塑故事,在階段 #2 增加保真度,並在一個連貫的工作流程中發佈帶有同步音頻的電影結果。

致謝#

此工作流程實施並基於以下作品和資源。我們感謝 Aiwood愛屋研究室對 LTX 2.3 導演工作流程的貢獻和維護。欲了解權威細節,請參考下方鏈接的原始文檔和存儲庫。

資源#

注意:參考模型、數據集和代碼的使用受其作者和維護者提供的相應許可和條款的約束。

RunComfy
版權 2026 RunComfy. 保留所有權利。

RunComfy 是首選的 ComfyUI 平台,提供 ComfyUI 在線 環境和服務,以及 ComfyUI 工作流程 具有驚豔的視覺效果。 RunComfy還提供 AI Models, 幫助藝術家利用最新的AI工具創作出令人驚艷的藝術作品。