이 워크플로우는 처음부터 끝까지 비디오 캐릭터 교체 (MoCha)를 제공합니다: 실제 비디오에서 연기자를 새로운 캐릭터로 교체하면서 모션, 조명, 카메라 관점 및 장면 연속성을 유지합니다. Wan 2.1 MoCha 14B 프리뷰를 중심으로 구축되어, 참조 정체성을 소스 퍼포먼스에 맞추고, 일관된 편집 클립과 선택적인 비교 영상을 합성합니다. 이는 정밀하고 고품질의 캐릭터 교체가 필요한 영화 제작자, VFX 아티스트 및 AI 창작자를 위해 설계되었습니다.
파이프라인은 강력한 첫 프레임 마스킹과 Segment Anything 2 (SAM 2), MoCha의 모션 인식 이미지 임베딩, WanVideo 샘플링/디코딩 및 얼굴 충실도를 향상시키는 선택적 초상화 보조를 결합합니다. 소스 비디오와 하나 또는 두 개의 참조 이미지를 제공하면, 이 워크플로우는 완료된 교체 비디오와 A/B 비교를 생성하여 비디오 캐릭터 교체 (MoCha)의 반복 평가를 빠르고 실용적으로 만듭니다.
Wan 2.1 MoCha 14B 프리뷰. 캐릭터 교체를 위한 핵심 비디오 생성기; MoCha 이미지 임베딩 및 텍스트 프롬프트에서 시간적으로 일관된 합성을 추진합니다. 효율성을 위한 fp8 스케일 변형을 포함하여 Kijai에 의해 WanVideo Comfy 형식으로 배포됩니다. Hugging Face: Kijai/WanVideo_comfy, Kijai/WanVideo_comfy_fp8_scaled
MoCha (Orange‑3DV‑Team). 여기서 사용된 임베딩 단계를 영감을 준 정체성/모션 컨디셔닝 방법 및 참조 구현; 비디오 캐릭터 교체 (MoCha)를 위한 참조 선택 및 포즈 정렬 이해에 도움이 됩니다. GitHub, Hugging Face
Segment Anything 2 (SAM 2). 배우를 첫 프레임에서 격리하는 고품질, 포인트 기반 세분화; 깨끗한 마스크는 안정적이고 아티팩트 없는 교체에 필수적입니다. GitHub: facebookresearch/segment-anything-2
Qwen‑Image‑Edit 2509 + Lightning LoRA. 두 번째 참조로 사용할 수 있는 깨끗한 클로즈업 초상화를 생성하는 선택적 단일 이미지 보조, 어려운 장면에서 얼굴 정체성 보존을 개선합니다. Hugging Face: Comfy‑Org/Qwen‑Image‑Edit_ComfyUI, lightx2v/Qwen‑Image‑Lightning
Wan 2.1 VAE. 효율적인 잠재 처리에 사용되는 Wan 샘플러/디코더 단계의 비디오 VAE. Hugging Face: Kijai/WanVideo_comfy
전체 논리
입력 비디오
첫 프레임 마스크
ref1
ref2 (선택 사항)
단계 1 - 모델 로드
단계 2 - 편집할 이미지 업로드
단계 4 - 프롬프트
장면 2 - 샘플링
Mocha
MochaEmbeds 단계는 소스 비디오, 첫 프레임 마스크, 참조 이미지(들)을 MoCha 이미지 임베딩으로 인코딩합니다. 임베딩은 정체성, 질감 및 지역적 외형 단서를 잡아내면서 원래의 모션 경로를 존중합니다. ref2가 존재하면 얼굴 세부정보를 강화하는 데 사용됩니다; 그렇지 않으면 ref1만으로 정체성을 유지합니다.Wan 모델
Wan 샘플링
MochaEmbeds (#302). 소스 클립, 첫 프레임 마스크 및 참조 이미지를 MoCha 이미지 임베딩으로 인코딩하여 정체성과 외형을 조정합니다. 첫 프레임과 일치하는 ref1 포즈를 선호하고, 드리프트가 보이면 깨끗한 얼굴을 위한 ref2를 포함하세요. 가장자리가 흔들리면 배경 누출을 피하기 위해 임베딩 전에 마스크를 약간 확장하세요.
Sam2Segmentation (#326). 긍정적/부정적 클릭을 첫 프레임 마스크로 변환합니다. 머리카락과 어깨 주위의 깨끗한 가장자리를 우선시하세요; 가까운 소품을 제외하기 위해 몇 가지 부정적 포인트를 추가하세요. 세분화 후 마스크를 약간 확장하면 배우가 움직일 때 안정성을 돕습니다.
WanVideoSampler (#314). 잠재를 프레임으로 디노이징하여 비디오 캐릭터 교체 (MoCha)의 무거운 작업을 수행합니다. 더 많은 단계는 세부사항과 시간적 안정성을 개선합니다; 더 적은 단계는 반복 속도를 높입니다. 참조나 마스크의 변경을 비교할 때 스케줄러를 일관되게 유지하세요.
WanVideoSetBlockSwap (#344). VRAM이 부족할 경우, 더 깊은 블록 교체를 활성화하여 Wan 2.1 MoCha 14B 경로를 작은 GPU에 맞출 수 있습니다. 약간의 속도 손실을 기대하세요; 그 대가로 해상도와 시퀀스 길이를 유지할 수 있습니다.
VHS_VideoCombine (#355). 최종 MP4를 작성하고 워크플로우 메타데이터를 임베드합니다. 소스와 동일한 프레임 속도 (이미 유선으로 전달됨)와 넓은 플레이어 호환성을 위한 yuv420p 출력을 사용하세요.
깨끗한 교체를 위한 팁
유용한 참조
이 워크플로우는 다음 작업과 리소스를 구현하고 확장합니다. 우리는 그들의 기여와 유지 보수에 대해 Benji’s AI Playground의 “비디오 캐릭터 교체 (MoCha)”에 감사를 표합니다. 권위 있는 세부 사항은 아래에 연결된 원본 문서 및 저장소를 참조하십시오.
참고: 참조된 모델, 데이터셋 및 코드의 사용은 해당 저자 및 유지 관리자가 제공한 각각의 라이선스 및 조건에 따라야 합니다.
RunComfy는 최고의 ComfyUI 플랫폼으로서 ComfyUI 온라인 환경과 서비스를 제공하며 ComfyUI 워크플로우 멋진 비주얼을 제공합니다. RunComfy는 또한 제공합니다 AI Playground, 예술가들이 최신 AI 도구를 활용하여 놀라운 예술을 창조할 수 있도록 지원합니다.