此工作流程提供端到端的影片角色替換 (MoCha):在實際影片中將表演者替換為新角色,同時保留動作、光影、攝影機視角和場景連續性。基於 Wan 2.1 MoCha 14B 預覽版設計,將參考身份與源表演對齊,然後合成連貫的編輯片段和可選的並排比較。專為需要精確、高質量角色交換且只需最少手動清理的電影製作人、視效藝術家和 AI 創作者設計。
該流程結合了強大的首幀遮罩、Segment Anything 2 (SAM 2)、MoCha 的動作感知圖像嵌入、WanVideo 採樣/解碼,以及可選的肖像輔助來提高面部保真度。您提供一個源視頻和一到兩張參考圖像;該工作流程生成一個完成的替換視頻以及 A/B 比較,使影片角色替換 (MoCha) 的迭代評估快速且實用。
Wan 2.1 MoCha 14B 預覽版。核心視頻生成器,用於角色替換;從 MoCha 圖像嵌入和文本提示中驅動時間一致的合成。模型權重由 Kijai 以 WanVideo Comfy 格式分發,包括效率提升的 fp8 縮放變體。Hugging Face: Kijai/WanVideo_comfy, Kijai/WanVideo_comfy_fp8_scaled
MoCha (Orange‑3DV‑Team)。身份/動作調節方法和參考實現,啟發了此處使用的嵌入階段;有助於理解參考選擇和姿勢對齊的影片角色替換 (MoCha)。GitHub, Hugging Face
Segment Anything 2 (SAM 2)。高質量、點引導分割,用於隔離首幀中的演員;乾淨的遮罩對於穩定、無瑕疵的交換至關重要。GitHub: facebookresearch/segment-anything-2
Qwen‑Image‑Edit 2509 + Lightning LoRA。可選的單圖像輔助,生成乾淨的特寫肖像作為第二個參考,改善困難鏡頭中的面部身份保留。Hugging Face: Comfy‑Org/Qwen‑Image‑Edit_ComfyUI, lightx2v/Qwen‑Image‑Lightning
Wan 2.1 VAE。由 Wan 採樣器/解碼器階段使用的視頻 VAE,用於高效的潛在處理。Hugging Face: Kijai/WanVideo_comfy
整體邏輯
輸入視頻
首幀遮罩
ref1
ref2(可選)
步驟1 - 加載模型
步驟2 - 上傳要編輯的圖像
步驟4 - 提示
場景2 - 採樣
Mocha
MochaEmbeds 階段將源視頻、首幀遮罩和您的參考圖像編碼為 MoCha 圖像嵌入。嵌入捕捉身份、紋理和局部外觀提示,同時尊重原始運動路徑。如果存在 ref2,則用於加強面部細節;否則,僅 ref1 攜帶身份。Wan 模型
Wan 採樣
MochaEmbeds (#302)。將源片段、首幀遮罩和參考圖像編碼為 MoCha 圖像嵌入,以引導身份和外觀。選擇一個與首幀匹配的 ref1 姿勢,並包括 ref2 以獲得乾淨的面部;如果邊緣閃爍,在嵌入前稍微擴大遮罩以避免背景洩漏。
Sam2Segmentation (#326)。將您的正/負點擊轉換為首幀遮罩。優先考慮頭髮和肩膀周圍的乾淨邊緣;添加一些負點以排除附近的道具。分割後略微擴大遮罩有助於演員移動時的穩定性。
WanVideoSampler (#314)。通過去噪潛在圖像生成幀,推動影片角色替換 (MoCha) 的繁重工作。更多步驟改善細節和時間穩定性;更少的步驟加快迭代速度。在比較參考或遮罩的變化時,保持調度一致。
WanVideoSetBlockSwap (#344)。當 VRAM 緊張時,啟用更深的塊交換以適應小型 GPU 上的 Wan 2.1 MoCha 14B 路徑。預期會有一些速度損失;作為回報,您可以保持分辨率和序列長度。
VHS_VideoCombine (#355)。寫入最終的 MP4 並嵌入工作流程元數據。使用與源相同的幀率(已經連接)和 yuv420p 輸出,以便廣泛的播放器兼容性。
乾淨交換的提示
有用的參考資料
此工作流程實施並基於以下作品和資源。我們感謝“Video Character Replacement (MoCha)”的 Benji’s AI Playground 為影片角色替換 (MoCha) 的貢獻和維護。欲了解權威的詳細信息,請參閱下面鏈接的原始文檔和儲存庫。
注意:所引用的模型、數據集和代碼的使用受其作者和維護者提供的相應許可和條款的約束。
RunComfy 是首選的 ComfyUI 平台,提供 ComfyUI 在線 環境和服務,以及 ComfyUI 工作流程 具有驚豔的視覺效果。 RunComfy還提供 AI Playground, 幫助藝術家利用最新的AI工具創作出令人驚艷的藝術作品。