ENTIRE AI WORLDS (Vace Wan 2.1)는 Mickmumpitz가 개발한 제작 준비 완료 ComfyUI 워크플로우로, 실사 영상을 새로운 환경으로 변환하면서 원본 카메라 모션을 유지합니다. 배경을 교체하고, 관점과 규모를 유지하며, 마스크된 배우를 텍스트와 참조 이미지를 통해 완전히 재생성된 세계에 합성합니다.
Wan 2.1 VACE 스택을 기반으로 한 이 워크플로우는 빠른 프리비즈나 완성된 샷이 필요한 영화 제작자, VFX 아티스트 및 창작자에게 이상적입니다. 장면을 프롬프트로 지시하고, 선택적 참조 이미지에서 시작하며, 고속 FP8 파이프라인 또는 저 VRAM GGUF 파이프라인 중 선택할 수 있습니다. 결과는 일관된 세계 구축을 가능하게 하며, 일상적인 플레이트에서 ENTIRE AI WORLDS (Vace Wan 2.1)를 진정으로 생성할 수 있게 합니다.
이 워크플로우는 두 단계 VACE 전략을 따릅니다: 먼저, 제어 이미지에서 장면 모션을 인코딩하여 카메라 움직임을 고정합니다; 두 번째로, 배우를 삽입하고 재생성된 환경에 혼합합니다. 최대 속도를 위해 FP8 경로를 실행하거나 저 VRAM을 위해 GGUF 경로를 실행할 수 있습니다. 아래 섹션은 그래프 그룹에 매핑되어 전체 ENTIRE AI WORLDS (Vace Wan 2.1) 파이프라인을 자신 있게 운영할 수 있습니다.
입력 영역에서는 작업 해상도와 기본 클립 제어를 선택할 수 있습니다. 해상도 스위치를 사용하여 프리셋(720p, 576p 또는 480p)을 선택하면 Set_width
(#370) 및 Set_height
(#369)에 피드되어 모든 단계가 동기화됩니다. 회전 시간을 빠르게 유지하려면 프레임 수를 제한하고, 시작점을 오프셋하려면 작은 스킵을 설정할 수 있습니다. 안정성과 메모리를 위해, 시퀀스를 권장 범위 내에 유지하십시오; 그래프 레이블은 대부분의 GPU에 대해 81 프레임이 합리적인 최대치임을 나타냅니다. 이러한 선택은 제어 이미지, VACE 인코딩 및 최종 렌더링에 전역적으로 적용됩니다.
참고: 입력 비디오는 다른 워크플로우, MASK_AND_TRACK를 통해서도 생성할 수 있습니다. 해당 워크플로우 파일은 여기에서 다운로드할 수 있습니다: workflow.json. 다운로드 후, 파일을 새로운 워크플로우 탭에 끌어다 놓고 실행하여 입력 비디오를 얻으십시오.
배경 플레이트와 선택적 참조 이미지는 시각적 스타일을 안내합니다. 배경 스틸을 로드한 후, 그래프가 작업 크기에 맞게 크기를 조정합니다. 하드 백플레이트 대신 스타일 앵커를 원한다면 선택기를 통해 reference_image
를 활성화하십시오; 이 이미지는 색상, 구성 및 톤을 안내하지만 기하학을 지시하지 않습니다. 참조 경로는 특정 외형을 반영하는 ENTIRE AI WORLDS (Vace Wan 2.1)를 모델이 생성하도록 할 때 유용하며, 텍스트 프롬프트는 나머지를 처리합니다. 텍스트 전용 제어를 선호할 때는 이를 끄십시오.
이 섹션을 사용하여 생성 시작을 결정하십시오. 준비된 배우 스틸로 Image Remove Background Rembg (mtb)
(#1433)은 깨끗한 마스크를 얻고, ImageCompositeMasked
(#1441)는 배우를 선택한 배경에 배치하여 시작 프레임을 형성합니다. Start Frame
스위치 (ImpactSwitch
, #1760)는 세 가지 모드를 제공합니다: 합성 배우 및 배경, 배경만, 또는 시작 프레임 없음. 시작 프레임은 정체성과 레이아웃을 고정하는 데 도움이 되며; 배경만으로는 시간이 지남에 따라 캐릭터가 "입장"하게 하며; 시작 프레임이 없으면 모델이 텍스트와 참조로 주제와 세계를 모두 설정하도록 요청합니다. 라이브 미리보기 블록은 하위 스트림을 커밋하기 전에 시작이 어떻게 보이는지 보여줍니다.
제어 이미지는 카메라의 움직임을 고정하여 관점과 시차가 실제로 느껴지도록 합니다. 카메라 트랙 비디오를 그룹에 피드하십시오; 그래프는 OpenPose 및 Canny 레이어를 도출한 후 강한 구조 신호를 생성하기 위해 혼합할 수 있습니다. Control Image Nodes
스위치 (ImpactSwitch
, #1032)는 트랙 전용, 트랙+포즈, Canny+포즈, 또는 외부에서 준비된 제어 비디오 중에서 선택할 수 있습니다. 실루엣과 가장자리가 명확하게 읽히는지 미리보기 결합으로 스택을 검토하십시오. 긴 시퀀스의 경우, 프롬프트나 마스크를 반복하면서 계속해서 ENTIRE AI WORLDS (Vace Wan 2.1)를 생성할 때 구조를 다시 계산하지 않도록 이 제어 비디오를 저장하고 나중에 다시 로드할 수 있습니다.
이미 "제어 이미지" 비디오를 내보낸 경우, 여기에서 드롭하여 전처리를 우회하십시오. 제어 이미지 스위치에서 해당 옵션을 선택하여 나머지 파이프라인이 캐시된 구조를 사용하도록 하십시오. 이는 카메라 트래킹을 일관되게 유지하고 긴 테이크에서 반복 시간을 크게 줄입니다.
FP8 분기는 전체 Wan 2.1 모델 스택을 로드합니다. WanVideoModelLoader
(#4)는 T2V 14B 백본과 VACE 모듈, 그리고 빠르고 일관된 샘플링을 위한 선택적 LightX LoRA를 불러옵니다. WanVideoVAELoader
(#26)는 VAE를 제공합니다, 그리고 WanVideoBlockSwap
(#5)는 필요한 경우 블록을 장치 메모리로 교체하여 VRAM 절약 전략을 노출합니다. 이 분기는 VRAM 여유 공간이 있을 때 ENTIRE AI WORLDS (Vace Wan 2.1)를 생성하는 가장 빠른 방법입니다.
프롬프트는 WanVideoTextEncodeSingle
에 의해 긍정 및 부정 텍스트로 인코딩된 후 일관성을 유지하기 위해 WanVideoApplyNAG
를 통해 정제됩니다. 첫 번째 패스, WanVideo VACE Encode (CN‑CameraTrack)
(#948)은 제어 이미지를 읽어 모션 인식 임베딩을 생성합니다. 두 번째 패스, WanVideo VACE Encode (InsertPerson)
(#1425)은 깨끗한 알파와 마스크를 사용하여 배우를 주입합니다. WanVideoSampler
(#2)는 시퀀스를 렌더링하고, WanVideoDecode
(#1)는 잠재를 프레임으로 변환하며, 간단한 스위치가 원본 프레임 속도와 FILM 보간 스트림 중에서 선택한 후 최종 비디오를 결합합니다.
GGUF 분기는 낮은 VRAM 워크플로우를 위해 설계되었습니다. UnetLoaderGGUF
(#1677)는 양자화된 Wan 2.1 VACE UNet을 로드하고, CLIPLoader
(#1680)는 텍스트 인코더를 제공합니다, 그리고 LoraLoader
(#2420)를 사용하여 LoRA를 적용할 수 있습니다. 표준 ComfyUI VAELoader
(#1676)는 디코드를 처리합니다. 이 경로는 속도를 희생하고 발자국을 줄이는 대신, 동일한 두 단계 VACE 논리를 유지하여 적은 하드웨어에서도 ENTIRE AI WORLDS (Vace Wan 2.1)를 생성할 수 있게 합니다.
양자화된 경로에서는 WanVaceToVideo
(#1724)가 VACE 임베딩, 텍스트 조건부, 참조를 유도된 잠재로 변환합니다. WanVideoNAG
와 WanVideoEnhanceAVideoKJ
는 정체성과 로컬 디테일을 유지한 후 KSampler
(#1726)가 최종 잠재 시퀀스를 생성합니다. VAEDecode
(#1742)는 프레임을 생성하고, 선택적 FILM 단계는 시간적 부드러움을 추가하며, 비디오 결합은 결과를 디스크에 기록합니다. VRAM이 부족하거나 긴 안정적인 샷이 필요할 때 이 경로를 사용하십시오.
프롬프트 패널은 두 개가 있습니다. FP8 측은 Wan T5 텍스트 인코더를 사용하고, GGUF 측은 CLIP 조건부 경로를 사용합니다; 두 측 모두 긍정 및 부정 텍스트를 수신합니다. 긍정 프롬프트는 생성하고자 하는 세계에 대해 시네마틱하고 구체적이어야 하며, 부정 프롬프트는 압축 아티팩트, 과포화, 원치 않는 전경 잡음을 위해 예약하십시오. 부드러운 참조 이미지를 사용하여 색상과 조명을 조정하면서도 모델이 ENTIRE AI WORLDS (Vace Wan 2.1)를 생성하도록 할 수 있습니다.
WanVideo VACE Encode (CN-CameraTrack)
(#948)WanVideo VACE Encode (InsertPerson)
(#1425)DilateErodeMask
, #2391)을 조정하여 매트를 약간 당겨오십시오. 이 패스는 삽입을 장면 모션에 연결하여 규모와 시차를 자연스럽게 유지합니다.WanVaceToVideo
(#1724 및 #1729)WanVideoSampler
(#2)KSampler
(#1726)Enhance A Video
블록을 활용하여 모션을 드리프트하지 않고 미세 질감을 회복하십시오.FILM VFI
(#2019 및 #1757)DilateErodeMask
를 사용하여 배우 마스크를 조정하여 후광을 없애십시오.이 단계들을 통해, 실사 카메라 모션에서도 견딜 수 있는 ENTIRE AI WORLDS (Vace Wan 2.1)를 자신 있게 실행할 수 있습니다.
이 워크플로우는 @mickmumpitz 작업과 리소스를 구현하고 확장합니다. 우리는 Mickmumpitz의 워크플로우 튜토리얼에 대한 감사의 말씀을 전하며, 그의 기여와 유지 관리에 감사드립니다. 권위 있는 세부 사항은 아래에 링크된 원본 문서 및 저장소를 참조하십시오.
참고: 참조된 모델, 데이터 세트 및 코드의 사용은 Mickmumpitz가 제공한 각각의 라이선스 및 조건에 따릅니다.
RunComfy는 최고의 ComfyUI 플랫폼으로서 ComfyUI 온라인 환경과 서비스를 제공하며 ComfyUI 워크플로우 멋진 비주얼을 제공합니다. RunComfy는 또한 제공합니다 AI Playground, 예술가들이 최신 AI 도구를 활용하여 놀라운 예술을 창조할 수 있도록 지원합니다.