WAN 2.2 Smooth Workflow v5.0: 一個整合於 ComfyUI 的五秒流暢視頻管道#
WAN 2.2 Smooth Workflow v5.0 是一個涵蓋文本轉視頻、圖像轉視頻、首尾幀動畫和音訊轉視頻的單一畫布。它基於 SmoothMix WAN 2.2 模型系列構建,並可選擇使用 Lightx2v LoRAs、WAN 2.x 的 WanVideoWrapper 操作和 RIFE 幀插值,使您能生成具有一致運動和快速迭代的短電影片段。
當您需要一個有組織的圖表來在不重新接線的情況下切換 T2V、I2V、F2LF 和 A2V 時,請使用這個 WAN 2.2 Smooth Workflow v5.0。畫布包含模式切換、持續時間和尺寸控制、最後幀預覽,以及可選的音訊分支,可跟隨您的片段的視覺節奏。
Comfyui WAN 2.2 Smooth Workflow v5.0 的關鍵模型#
- SmoothMix WAN 2.2 文本轉視頻和圖像轉視頻檢查點(高和低)
- 角色:主要的擴散骨幹,用於跨 T2V 和 I2V 路徑的運動合成和精煉。高檢查點偏重於質量和細節;低檢查點偏重於速度和 VRAM 空間。
- Lightx2v WAN 2.2 Distill LoRAs
- 角色:WAN 2.2 的可選 LoRAs,增強運動流暢性或風格化,同時保持提示的響應性。根據需要加載以引導外觀和動態。lightx2v/Wan2.2-Distill-Loras
- WAN 2.x VAE
- 角色:在整個畫布中使用的 VAE,用於編碼和解碼視頻潛變數,確保圖像質量和顏色響應在各個分支中保持一致。
- WAN 2.x 文本編碼器 (uMT5 XXL 家族)
- 角色:WAN 2.x 使用的專用文本編碼器;工作流程加載匹配的標記器/模型,以便提示正確地條件化運動和外觀。
- CLIP Vision 編碼器 (ViT‑H 家族)
- 角色:提取首尾幀動畫路徑的堅固開始和結束幀嵌入,改善插值過程中的時間一致性。
- 音訊生成分支
- 角色:可選的幀感知音訊合成,根據視覺時間和文本提示條件化,創建與視覺剪輯對齊的音軌元素。
- RIFE 視頻插值
- 角色:通過插入高質量的中間幀來增加時間流暢性和表觀幀率,適合短電影迴圈。通過 ComfyUI VFI 集成使用。GACLove/ComfyUI-VFI
如何使用 Comfyui WAN 2.2 Smooth Workflow v5.0#
畫布組織成四種生產模式,您可以從畫布上的開關啟用。跨模式您將看到檢查點、CLIP/VAE、提示、視頻尺寸和長度、採樣和視頻結果的一致組。每種模式可以選擇性地通過音訊啟用開關啟用音訊生成。
文本轉視頻 (T2V)#
在正向提示中輸入您的描述,並用負向提示進行精煉。提示文本在 CLIPTextEncode (#90) 中編碼,並與 WAN 2.x VAE 結合。即使沒有開始圖像,WanImageToVideo (#50) 也作為 T2V 入口點,生成初始潛在序列,然後傳遞給採樣器再進行解碼。RIFE 插值 RIFEInterpolation (#160) 在 VHS_VideoCombine (#77) 導出您的 MP4 之前平滑序列。使用音訊啟用器從您的幀和音訊提示生成音軌。
圖像轉視頻 (I2V)#
在圖像組中放置單個圖像,然後設置視頻尺寸和持續時間。圖像被調整大小並發送到 WanImageToVideo (#172),與您的文本提示一起,生成運動感知潛在變數。配對的採樣器精煉潛變數,然後結果被解碼、升級和插值,輸出流暢的結果。如果您希望生成的聲音與動畫內容匹配,請啟用 I2V 音訊組。
首尾幀動畫 (F2LF)#
提供開始幀和結束幀。圖表使用 CLIP Vision 編碼兩者,並將其傳遞到 WanFirstLastFrameToVideo (#343),在第一和最後的圖像之間規劃一條路徑,同時尊重您的文本提示。高和低 SmoothMix 採樣器然後雕刻中間幀,然後進行解碼和插值。結果由 VHS_VideoCombine (#332) 導出,並且可選的音訊分支可以合成與視覺過渡對齊的音軌。
音訊轉視頻 (A2V)#
在 VHS_LoadVideo (#145) 中載入現有剪輯。工作流程可以選擇性地插值以獲得額外流暢性,然後音訊分支根據視覺效果和您的音訊提示創建聲音。VHS_VideoCombine (#148) 合併音軌並導出新文件。使用畫布上的最後幀預覽快速檢查導出前的視覺一致性。
導出和最後幀預覽#
每種模式以視頻結果組結束,通過 VideoHelperSuite 的 VHS_VideoCombine 節點寫入 MP4。專用的最後幀窗格保存並預覽最終幀,讓您在運行完整生成之前一目瞭然地判斷光照、顏色和主題質量。視頻 I/O 和預覽功能由 VideoHelperSuite 提供。pythongosssss/ComfyUI-VideoHelperSuite
Comfyui WAN 2.2 Smooth Workflow v5.0 的關鍵節點#
WanImageToVideo (#50)
- 這是 WAN 2.x 預設的視頻入口點,適用於 WanVideoWrapper 內的 T2V 和 I2V。它將您的提示與 VAE(以及可選的開始圖像)合併,以構建初始運動潛在變數。上游的尺寸和長度控制必須尊重模型友好的約束,並且此節點會將後續的配對採樣器進行餵料。WanVideoWrapper 的實施細節和更新在此維護:kijai/ComfyUI-WanVideoWrapper
WanFirstLastFrameToVideo (#343)
- 通過攝取首尾幀的 CLIP Vision 嵌入以及您的文本提示來驅動首尾幀路徑。它創建一條引導軌跡,保持主題身份和場景佈局,同時向目標變形。在主題比例和構圖中保持開始和結束幀的對齊,以獲得最自然的過渡。
KSamplerWithNAG (Advanced) (#234)
- 應用噪聲輔助引導以改善提示依從性並減少短片中的時間漂移。僅在看到過度約束或不足約束時調整其引導;它與標準採樣器和您的負向提示協同工作。請參閱項目文檔中的方法和調整指南:scottmudge/ComfyUI-NAG
RIFEInterpolation (#160)
- 在編碼為視頻之前插入高質量的中間幀以改善運動流暢性。當您的基本序列在幀與幀之間看起來不錯但播放時感覺有點卡頓時使用。該節點集成了 ComfyUI VFI 擴展提供的 RIFE 實施。GACLove/ComfyUI-VFI
VHS_VideoCombine (#77)
- 處理最終編碼、混合可選音訊並保存元數據。保持其格式和像素格式在項目中一致,以獲得可預測的播放效果。VideoHelperSuite 還為畫布上的快速最後幀預覽工具提供動力。pythongosssss/ComfyUI-VideoHelperSuite
可選附加功能#
- 使用高對低 SmoothMix 檢查點來平衡質量和速度。高點適合英雄鏡頭和最後一次迭代,低點幫助您更快地迭代提示和時間。
- 保持視頻寬度和高度在模型友好的倍數中,以最小化伪影並加快採樣速度。
- 如果 T2V 剪輯看起來靜態,請刷新種子或在提示中強化運動動詞,然後再提高採樣深度。
- 對於 F2LF,選擇具有相似攝像機角度和曝光的邊界幀。構圖中的大跳躍更難以順利解決。
- 畫布包括自適應提示助手,當您需要快速變化而不手動重寫提示時提供更豐富的措辭。Alectriciti/comfyui-adaptiveprompts
這個 WAN 2.2 Smooth Workflow v5.0 設計旨在最大限度地減少模式切換摩擦,同時保持結果流暢且電影化。從匹配您輸入的模式開始,設置尺寸和持續時間,寫下清晰的提示對,然後讓採樣器加上 RIFE 完成其餘的工作。
感謝#
此工作流程實現並建立在以下作品和資源的基礎上。我們感謝 Civitai 創作者提供的 Smooth Workflow Wan 2.2 AIO 工作流程和 Smooth Mix Wan 2.2 14B I2V/T2V 模型,kijai 提供的 ComfyUI-WanVideoWrapper 以及 lightx2v (ModelTC) 提供的 Wan2.2-Distill-Loras 的貢獻和維護。對於權威的詳細信息,請參閱以下鏈接的原始文檔和存儲庫。
資源#
- Civitai/Smooth Workflow Wan 2.2 AIO (Workflow v5.0)
- 文檔 / 發布說明: 工作流程來源
- Civitai/Smooth Mix Wan 2.2 14B (I2V/T2V)
- 文檔 / 發布說明: SmoothMix WAN 2.2 I2V/T2V 模型
- kijai/ComfyUI-WanVideoWrapper
- GitHub: kijai/ComfyUI-WanVideoWrapper
- lightx2v/Wan2.2-Distill-Loras
- GitHub: ModelTC/LightX2V
- Hugging Face: lightx2v/Wan2.2-Distill-Loras
注意:所引用的模型、數據集和代碼的使用受其作者和維護者提供的相應許可和條款的約束。

