ComfyUI>工作流程>LTX 2.3 Sulphur T2V 流程 | 電影級文字轉影片生成器

LTX 2.3 Sulphur T2V 流程 | 電影級文字轉影片生成器

Workflow Name: RunComfy/LTX-2.3-Sulphur-T2V
Workflow ID: 0000...1417
使用先進的 Sulphur T2V 系統將文字提示轉換為電影級影片場景。生成表達性的角色動作、細微的面部微表情以及大氣的環境,讓您的故事栩栩如生。專為尋求創造性控制攝影機角度和空間深度的創作者設計,這個設置提供詳細的故事敘述和視覺衝擊。集成的攝影機控制指導和精煉生成使每個鏡頭都顯得有意圖。實現專業級輸出,設置最少且保持可控的藝術流暢性。

ComfyUI LTX 2.3 Sulphur T2V workflow 工作流程

LTX 2.3 Sulphur T2V workflow in ComfyUI | Cinematic Text-to-Video
想要運行這個工作流程嗎?
  • 完全可操作的工作流程
  • 沒有缺失的節點或模型
  • 無需手動設置
  • 具有驚豔的視覺效果

ComfyUI LTX 2.3 Sulphur T2V workflow 範例

LTX 2.3 Sulphur T2V 流程:從提示到電影,帶有微表情、氛圍和指導攝影機#

LTX 2.3 Sulphur T2V 流程將精心編寫的提示轉換為強調可信微表情、大氣場景細節和故事驅動運動的電影剪輯。它結合了精煉的 LTX 2.3 生成通過 Sulphur 風格指導、可選的攝影機控制指導和穩定的拼圖解碼路徑,以獲得可靠的文字轉影片結果。

專為希望獲得扎實的表演節奏和可控攝影機運動的創作者而設計,這個 ComfyUI 設置將敘述的真實性與時間穩定性平衡。您可以運行純文字轉影片或從靜態圖像開始,然後將穩定的第一遍潛在解碼為一個乾淨的編輯器友好序列,並附帶占位音軌以方便編輯。

Comfyui LTX 2.3 Sulphur T2V 流程中的關鍵模型#

  • Lightricks LTX‑2.3 22B FP8 檢查點。驅動生成和解碼的基礎文字轉影片模型。模型庫
  • LTX‑2.3 精煉 LoRA。一個精煉的適配器,保持質量同時實現更快、更低步驟的抽樣和穩定運動。模型家族
  • LTX‑2.3 空間升頻器 x2。包含在圖中以供實驗,而默認導出路徑使用穩定的第一遍解碼以在此設置上獲得更乾淨的結果。升頻器
  • LTX‑2 19B LoRA 攝影機控制多莉左。可選指導,用於穩定的推進運動和溫和的視差,當您的場景需要時。LoRA
  • LTX 文字編碼器(Gemma 3 12B 變體)。解釋您的提示和節拍筆記的分詞器和嵌入模型。文字編碼器
  • LTX 音頻 VAE。打包一個靜音音頻流,以便生成的影片能在 NLEs 中乾淨載入。模型庫
  • Sulphur LoRA(捆綁)。一個風格和表演節拍適配器,專為表達性但克制的微表情和電影色彩和諧而設計。

如何使用 Comfyui LTX 2.3 Sulphur T2V 流程#

此流程默認使用穩定的第一遍文字轉影片路徑。它生成一致的影片潛在,分離影片和音頻通道,使用拼圖 VAE 解碼第一遍影片潛在,然後將幀和靜音音頻打包成準備好編輯的影片文件。潛在升頻和精煉節點保留在圖中以供高級實驗,但默認輸出繞過該分支以提高可靠性。

模型#

模型組加載 LTX‑2.3 FP8 檢查點、LTX 文字編碼器、音頻 VAE 和整個使用的適配器。精煉和 Sulphur LoRAs 應用於基礎模型,使場景緊密遵循您的節拍和面部意圖。如果您想要推進運動,請在提供的 LoraLoader 節點中啟用攝影機控制 LoRA。默認路徑通過 CFGGuider (#42) 餵養主抽樣器,而保留精煉分支以供手動實驗。

提示#

Prompt 字段 (#29) 中將您的場景寫成簡短的節拍行加上簡短的攝影機筆記。積極文本由 CLIPTextEncode (#30) 編碼,而 CLIPTextEncode (#41) 中的精選消極列表抑制 CGI 光澤、工件、抖動和硬閃爍。保持表演指導簡潔,具體到眼睛、肩膀和呼吸,以解鎖此流程調整的微表情。攝影機語言如“慢手持推進”和“溫和視差”很好地映射到調度器和可選攝影機 LoRA。

影片設置#

在影片設置組 (#40, #25, #26, #27) 中選擇輸出 WidthHeightFrame RateLength。內部,流程派生半分辨率潛在以進行生成通過以提高時間一致性,然後直接解碼該穩定潛在。使用 Switch to Text to Video? (#28) 運行純 T2V,或關閉它並通過圖像預處理路徑輸入起始靜止圖像以進行受控 I2V。尺寸應保持常見的倍數,以便快速、圖塊友好的解碼。

空潛在#

EmptyLTXVLatentVideo (#21) 根據您的設置創建一個空白影片潛在,而 LTXVEmptyLatentAudio (#33) 則創建一個匹配的音頻潛在,以便容器多路復用器是編輯器友好的。如果您想從圖像開始,LTXVImgToVideoInplace (#22) 可以將其注入潛在時間線中,在可控的 strength 下。當 bypass 開啟時,節點將產生一個純文字驅動的初始化。

生成低分辨率#

音頻和影片潛在由 LTXVConcatAVLatent (#32) 合併並由 LTXVScheduler (#47) 計時,該計時器設置了一個影片感知的 sigma 調度以實現平滑的運動和攝影機移動。CFGGuider (#42) 將您的積極和消極條件與模型堆疊結合,SamplerCustomAdvanced (#9) 運行主生成通過。然後 LTXVSeparateAVLatent (#35) 將剪輯分回影片和音頻潛在;默認輸出使用此穩定影片潛在進行拼圖解碼。

可選潛在升頻#

LTXVLatentUpsampler (#13) 使用 LatentUpscaleModelLoader (#39) 中的 LTX x2 空間升頻器,同時保持時間結構完整。LTXVImgToVideoInplace (#14) 將升頻的影片潛在與現有的音頻通道重新包裝在一起。如果您想要進行更高分辨率的精煉實驗,這個分支仍然可用,但它不連接到默認最終輸出。

可選精煉#

精煉分支使用 CFGGuider (#8) 和 SamplerCustomAdvanced (#36) 進行短暫的手動 sigma 調度。對於想要測試高分辨率路徑的高級用戶來說很有用,但默認工作流程輸出繞過這個分支,因為穩定的第一遍拼圖解碼在提供的 RunComfy 設置上提供更乾淨的結果。

輸出#

VAEDecodeTiled (#43) 從 LTXVSeparateAVLatent (#35) 解碼穩定的影片潛在,LTXVAudioVAEDecode (#23) 生成一個靜音音軌以保持編輯器滿意。CreateVideo (#38) 以您選擇的 fps 組裝序列,SaveVideo (#45) 將其寫入磁盤。您得到了一個準備分享的影片,具有穩定的運動、乾淨的漸變和受控的攝影機流。

Comfyui LTX 2.3 Sulphur T2V 流程中的關鍵節點#

LTXVScheduler (#47)#

為第一遍組織影片感知的 sigma 序列。其移位控制影響運動在幀之間的累積強度;更高的移位強調攝影機移動和更快的主題運動,而較低的值則有利於更穩定的構圖。如果您啟用了攝影機控制 LoRA,適度的移位最適合避免誇張的漂移。

LTXVCropGuides (#10)#

從您的文字生成作物感知的條件通道,以便重要區域,尤其是面孔,以更高的保真度解析。使用它來引導微表情和眼睛細節,而不過度調整全局抽樣器。如果特寫看起來柔和,請收緊您的表演節拍,讓作物指南進行精細引導。

LTXVImgToVideoInplace (#22, #14)#

將靜止圖像轉換為時間一致的潛在或重新包裝升頻的潛在以進行可選精煉。strength 控制設置源圖像在時間線中保留多少;較低的值允許更多的生成適應,較高的值保持構圖和身份鎖定。切換 bypass 可以在 I2V 和純 T2V 之間清晰切換。

LTXVLatentUpsampler (#13)#

應用 LTX x2 空間升頻器在潛在中提升紋理和邊緣以進行可選精煉實驗。默認導出路徑不依賴於此節點,因此您可以在不更改主輸出鏈的情況下比較穩定的第一遍輸出與精煉分支。

CFGGuider (#42, #8) 和 KSamplerSelect (#17, #6)#

這些配對定義了模型遵循您的文本的嚴格程度以及其樣本的積極性。保持指導保守以實現影片現實主義;提高它可能增加提示的遵從性,但會使運動僵硬或增加閃爍。默認導出依賴於主抽樣器以實現穩定運動,而次級抽樣器則保留用於可選精煉測試。

可選附加項#

  • 撰寫 3 到 6 個描述意圖和肢體語言而非情節的節拍;微表情從具體的提示中浮現,如“眼睛柔和”或“肩膀放鬆”。
  • 保持攝影機語言簡潔:一個運動動詞加上一個主題,例如“慢推進到她的臉上”或“溫和視差從停著的車”。
  • 如果您想要靜態構圖,請禁用攝影機控制 LoRA 並稍微減少調度器移位;想要更多移動,則啟用 LoRA 並適度增加移位。
  • 使用寬度和高度是 32 的整數倍,以實現可預測的平鋪和解碼。
  • 為了可重現性,將種子鎖定在 RandomNoise (#2, #1) 中;探索變化時僅更改一個種子。
  • 否定提示已經抑制 CGI 假象和閃爍;保持其專注,讓您的積極文本傳達風格和意圖。

致謝#

此工作流程實施並建立在以下作品和資源之上。我們感謝 RunningHub 提供的工作流程參考,Lightricks 提供的 LTX 2.3 模型、精煉 LoRA 和空間升頻器,以及攝影機控制 LoRA,以及 Comfy-Org 提供的 LTX 文字編碼器對其貢獻和維護。欲了解權威細節,請參考以下鏈接的原始文檔和庫。

資源#

注意:使用所引用的模型、數據集和代碼受其作者和維護者提供的相應許可和條款約束。

RunComfy
版權 2026 RunComfy. 保留所有權利。

RunComfy 是首選的 ComfyUI 平台,提供 ComfyUI 在線 環境和服務,以及 ComfyUI 工作流程 具有驚豔的視覺效果。 RunComfy還提供 AI Models, 幫助藝術家利用最新的AI工具創作出令人驚艷的藝術作品。