ComfyUI>工作流程>SCAIL-2 動作轉移 | 長視頻創作者

SCAIL-2 動作轉移 | 長視頻創作者

Workflow Name: RunComfy/SCAIL-2-MotionTransfer
Workflow ID: 0000...1444
此工作流程幫助您將單個參考照片轉換為延長視頻,保持角色身份和風格的卓越精確度。它將您的圖像與動態運動鏡頭對齊,確保從幀到幀的細節一致。您可以通過先進的視頻調節和 LightX2V 加速來控制光照、遮罩和場景適應。非常適合展示時尚動作測試、編輯原型或以身份為重點的動畫片段。適合追求細節控制並希望最少手動修飾和專業級輸出的創作者。

ComfyUI SCAIL-2 character motion transfer, reference image to long video workflow, Western editorial market example Workflow

SCAIL-2 Motion Transfer in ComfyUI | Reference Image to Video
Want to run this workflow?
  • Fully operational workflows
  • No missing nodes or models
  • No manual setups required
  • Features stunning visuals

ComfyUI SCAIL-2 character motion transfer, reference image to long video workflow, Western editorial market example Examples

SCAIL-2 角色動作轉移:參考圖像到長視頻工作流程#

此 ComfyUI 管道通過借用驅動視頻中的動作,將單個參考圖像轉換為長時間、身份忠實的角色表演。基於 SCAIL-2 Wan 2.1 14B 路徑,使用 CLIP Vision 調節、基於 SAM 的人物遮罩和 LightX2V 加速,優化了長序列的穩定性和便於並排檢查。對於需要在數百幀中保持一致身份、服裝和風格的創作者來說,這是一個實用的 SCAIL-2 角色動作轉移參考圖像到長視頻工作流程。

使用它生成目錄風格的動作測試、參考圖像到視頻的演示以及西方編輯市場的範例視頻。工作流程支持可選的重光指導,以便主題可以與驅動場景和諧一致,同時保持面部和服裝細節與您的參考圖像對齊。

ComfyUI SCAIL-2 角色動作轉移參考圖像到長視頻工作流程中的關鍵模型#

  • SCAIL-2 在 Wan 2.1 14B。核心身份感知視頻擴散用於動作轉移。工作流程載入為 ComfyUI 打包的 14B SCAIL-2 權重,並將其與 Wan VAE 配對進行重建。查看 Comfy-Org/SCAIL-2 中的模型集合和 zai-org/SCAIL 中的方法概述。
  • OpenCLIP ViT-H/14 用於 CLIP Vision。從參考圖像中提取強大的身份和外觀嵌入來調節生成,提高角色在幀中的保真度。參考模型系列:laion/CLIP-ViT-H-14-laion2B-s32B-b79K
  • Segment Anything (SAM) 系列。提供人物遮罩和每幀跟踪,以定位驅動視頻和參考圖像中的主題,實現目標調節。項目參考:facebookresearch/segment-anything
  • LightX2V LoRA 和 WanAnimate Relight LoRA。可選適配器,工作流程加載以加速幀間推理並提供重光指導,使轉移的角色匹配驅動片段的光照。

如何使用 ComfyUI SCAIL-2 角色動作轉移參考圖像到長視頻工作流程#

在高層次上,您提供一個參考圖像和一個驅動視頻。分割組找到並遮罩兩個來源中的人,CLIP Vision 編碼參考身份,第一次通過生成初始段,並且多次通過循環將該分割邏輯滾動到整個時間軸,以傳遞長時間、一致的視頻。並排預覽面板使檢查身份和姿勢對齊變得容易。

模型#

此組初始化骨幹模型和可選適配器。UNet 加載 SCAIL-2 Wan 2.1 14B 檢查點,VAE 處理視頻幀的潛在解碼。工作流程還加載 CLIP Vision 用於身份嵌入,和兩個 LoRA 適配器:LightX2V 用於速度和 WanAnimate Relight 用於光照指導。文本提示由 Wan 文本堆棧編碼,以便在製作西方編輯市場範例時調整場景和音調,這很方便。

參數#

使用參數組設置項目範圍的控制。分辨率是公開的,因此您可以選擇快速的基準或適合您的 GPU 預算的更清晰設置。幀率決定驅動視頻的採樣方式以及輸出的編碼方式。段長度定義了每個推理塊包含多少幀,這使得長時間軸上的內存預測變得可預測。在進行完整剪輯之前,提供最終幀限制以限制在外觀開發期間的處理。

分割#

分割組準備乾淨、有針對性的動作轉移指導。VHS_LoadVideo (#33) 導入驅動視頻,幀被調整到您選擇的分辨率,以便它們與 SCAIL-2 路徑匹配。兩個跟踪器,SAM3_VideoTrack (#85) 用於姿勢視頻和 SAM3_VideoTrack (#91) 用於參考,運行人物檢測,由簡單的“人物”文本調節引導以提高召回率。SCAIL2ColoredMask (#104) 將跟踪合併為兩個一致的遮罩,一個用於姿勢視頻,一個用於參考圖像,生成節點消耗這些遮罩以保持編輯專注於主題。

第一次通過#

第一次通過啟動序列並建立身份鎖。CLIPVisionEncode (#76) 從參考圖像中提取嵌入,然後 WanSCAILToVideo (#114) 將這些嵌入與姿勢視頻和兩個遮罩結合,以產生第一個片段的潛在序列。一個簡單的采樣器堆棧 SamplerCustom (#19) 與 BasicScheduler (#18) 將這個潛在轉換為圖像,由 VAEDecode (#6) 解碼。此過程還公開了幀偏移,多次通過階段使用它來對齊後續塊。

多次通過#

多次通過組將運行擴展到長視頻而不失去一致性。for 循環對,easy forLoopStart (#233) 和 easy forLoopEnd (#234),在固定大小的片段中遍歷整個時間軸,同時將解碼幀作為時間上下文傳遞。WanSCAILToVideo (#115) 通過其 previous_frames 輸入消耗該上下文,改進面部、頭髮和衣服在段邊界上的連續性。采樣堆棧 SamplerCustom (#63) 由您選擇的采樣器和 sigma 日程驅動,因此您可以在速度和遵循之間取得平衡,VAEDecode (#66) 返回每個塊為圖像。然後,工作流程將範圍拼接在一起並準備導出。

遮罩#

遮罩組將在分割中計算的人物遮罩路由,以便第一次通過和多次通過節點接收正確的主題區域。Get_pose_video_mask (#122) 和 Get_reference_image_mask (#120) 確保樣式轉移和身份保留精確地應用在需要的地方,減少背景漂移並保護主題之外的場景細節。

啟用角色替換#

此組讓您在尊重原始背景的身份轉移和完整前景替換之間切換。easy imageRemBg (#204) 從參考圖像中移除背景,ImpactConditionalBranch (#270) 切換是否在下游使用清理過的前景。當您需要嚴格的角色更換時啟用它,這對於目錄式測試或必須與標準化外觀匹配的西方編輯市場範例很有用。

預覽和導出#

工作流程提供並排可視化和最終渲染。ImageConcatMulti (#153) 組合一個快速面板,顯示驅動姿勢幀和參考圖像進行合理性檢查。另一個 ImageConcatMulti (#72) 可以在輸入旁邊顯示模型輸出,以便逐鏡頭質量檢查。最終視頻由 VHS_VideoCombine (#71) 和 VHS_VideoCombine (#236) 編寫,可以包括來源的音頻以便評審保持對時間的忠實。

ComfyUI SCAIL-2 角色動作轉移參考圖像到長視頻工作流程中的關鍵節點#

WanSCAILToVideo (#114)#

通過融合姿勢幀、主題遮罩和來自參考圖像的 CLIP Vision 身份嵌入生成初始潛在片段。調整 pose_strength 在精確複製動作和允許細微樣式適應之間取得平衡。使用 length 匹配您的片段大小,以便采樣器每次處理可預測的塊。如果您嚴格替換屏幕上的人員,設置 replacement_mode 偏好身份而不是背景樣式。由 SCAIL-2 在 Wan 2.1 14B 支持,作為 Comfy-Org/SCAIL-2 中打包,並從 zai-org/SCAIL 中獲得方法背景。

WanSCAILToVideo (#115)#

在循環期間運行以覆蓋時間軸的其餘部分,提高時間穩定性。從先前片段提供 previous_frames,以幫助模型保持跨邊界的衣服細節和面部身份。video_frame_offsetprevious_frame_count 保持片段與驅動片段同步。當通過 LoRA 啟用重光指導時,在此通過中稍微增強樣式匹配以和諧全球光照。

SAM3_VideoTrack (#85, #91)#

檢測並跟踪姿勢視頻和參考圖像中的人物。“人物”文本調節在多個對象存在時提高了魯棒性。如果跟踪器漂移,提高檢測信心或限制 max_objects,以便始終選擇相同的主題。跟踪概念遵循 Segment Anything 系列,請參見 facebookresearch/segment-anything 以獲取背景。

CLIPVisionEncode (#76)#

生成條件每幀的參考身份嵌入。對於頭肩參考,保持 crop 在中性選擇,以便編碼器看到整個輪廓和服裝。如果主題在幀中較小,請準備更緊的參考圖像,而不是在節點內過度裁剪。此節點依賴於 OpenCLIP ViT-H/14 風格視覺特徵,如 laion/CLIP-ViT-H-14-laion2B-s32B-b79K 所示。

VHS_LoadVideo (#33)#

導入並可選擇地重新採樣驅動視頻以保持時間一致。匹配 force_rate 到所需的輸出節奏,然後在外觀開發期間保持它固定,以便在迭代中獲得可比結果。在測試期間使用可選的幀限制來加速周轉,然後在最終渲染時解除限制。

可選額外功能#

  • 為快速迭代選擇一個肖像友好的分辨率,然後在批准最終版本時升級。工作流程針對典型的 9:16 設置進行調整,當 GPU 記憶體允許時提供更高的選項。
  • 編寫描述服裝、年齡和設置的文本提示,以符合西方編輯市場範例規範,例如“明亮廚房中穿藍色毛衣的中年人”。
  • 如果主題的服裝必須精確,降低藝術提示並提高遮罩依賴性,以便系統優先考慮服裝和顏色而不是背景氛圍。
  • 當您想要嚴格替換屏幕上的人物時,使用角色替換。當您希望模型輕柔地將角色與場景和諧時,請將其關閉。
  • 避免驅動視頻中大量遮擋或快速剪切。適度的鏡頭運動和乾淨的正面運動產生最穩定的身份轉移。
  • 添加重光指導時,從保守開始,以便在仍然匹配場景光照方向的同時保持皮膚色調和材料自然。

致謝#

此工作流程實施並建立在以下作品和資源之上。我們感謝 zai-org 和 teal024 提供 SCAIL/SCAIL-2,Comfy-Org 提供 SCAIL-2 模型文件和 Wan 2.1 14B FP8 檢查點,以及 RunningHub 和 RunComfy 團隊提供的工作流程參考和雲保存工作流程的貢獻和維護。欲了解權威細節,請參考以下鏈接的原始文檔和存儲庫。

資源#

注意:使用參考的模型、數據集和代碼需遵循其作者和維護者提供的各自許可和條款。

RunComfy
版權 2026 RunComfy. 保留所有權利。

RunComfy 是首選的 ComfyUI 平台,提供 ComfyUI 在線 環境和服務,以及 ComfyUI 工作流程 具有驚豔的視覺效果。 RunComfy還提供 AI Models, 幫助藝術家利用最新的AI工具創作出令人驚艷的藝術作品。