Wan Alpha는 Wan 2.1 패밀리를 사용하여 네이티브 알파 채널을 가진 비디오를 생성하는 목적지향 ComfyUI 워크플로우입니다. RGB와 알파를 함께 생성하여 키잉이나 로토스코핑 없이 캐릭터, 소품, 효과를 타임라인에 바로 배치할 수 있습니다. VFX, 모션 그래픽, 인터랙티브 앱을 위한 Wan Alpha는 깔끔한 가장자리, 반투명 효과, 프레임 정밀 마스크를 제공하여 제작 준비가 되어 있습니다.
Wan2.1‑T2V‑14B 및 알파 인식 VAE 쌍을 중심으로 구축된 Wan Alpha는 충실도와 속도의 균형을 유지합니다. 선택 사항인 LightX2V LoRA 가속은 디테일을 유지하면서 샘플링을 단축시킵니다. 워크플로우는 RGBA 프레임 시퀀스와 빠른 검토를 위한 애니메이션 WebP 미리보기를 내보냅니다.
이 ComfyUI 그래프는 프롬프트에서 RGBA 프레임으로 가는 간단한 경로를 따릅니다: 모델 로드, 텍스트 인코딩, 비디오 잠재 할당, 샘플링, RGB와 알파를 동기화하여 디코딩, 저장.
모델 및 LoRA 로딩
Load Wan 2.1 t2v 14B
(#37)에서 기본 모델을 가져오세요. 가속 또는 스타일 세부 조정을 사용하는 경우 LoraLoaderModelOnly
(#59) 및 LoraLoaderModelOnly
(#65)를 순차적으로 적용하세요. 그런 다음 모델은 로드된 체크포인트와 호환되는 샘플러를 구성하는 ModelSamplingSD3
(#48)을 통과합니다. 이 스택은 Wan Alpha가 나중에 세부 조정할 모션 사전과 렌더링 스타일을 정의합니다.프롬프트 인코딩
Load Text Encoder
(#38)는 UMT5‑XXL 텍스트 인코더를 로드합니다. CLIP Text Encode (Positive Prompt)
(#6)에 설명을 입력하세요; 주제, 액션, 카메라 프레이밍, "투명 배경"이라는 문구를 간결하게 유지합니다. 필요하면 CLIP Text Encode (Negative Prompt) Useless s
(#7)를 사용하여 후광이나 배경 혼란을 방지하세요. 이러한 인코딩은 RGB와 알파 생성을 조건화하여 가장자리와 투명도 단서가 귀하의 의도에 따르도록 합니다.비디오 캔버스 설정
EmptyHunyuanLatentVideo
(#40)를 사용하여 잠재 비디오 캔버스를 정의합니다. width
, height
, frames
, fps
를 설정하여 촬영에 맞춥니다; 더 높은 해상도 또는 더 긴 클립은 더 많은 메모리가 필요합니다. 이 노드는 Wan Alpha가 모션과 외관을 채울 시간적으로 일관된 잠재 볼륨을 할당합니다. 나중에 다시 샘플링을 피하기 위해 편집에 맞춰 지속 시간과 프레임 속도를 일치시키는 것을 고려하십시오.생성
KSampler
(#3)은 모델 스택과 프롬프트 조건을 사용하여 비디오 잠재에 대한 확산을 수행합니다. 변형을 위해 seed
를 조정하고, 속도와 디테일을 균형있게 조정할 sampler
와 scheduler
를 선택합니다. LightX2V LoRA가 활성화된 경우 더 빠른 렌더를 위해 더 적은 단계를 사용할 수 있으며, 안정성을 유지합니다. 출력은 다음 디코딩 단계에서 완벽한 RGBA 정렬을 보장하기 위해 공유되는 단일 잠재 스트림입니다.RGB 및 알파 디코딩
RGB VAE Decode
(#8)는 VAELoader
(#39)와 함께 RGB 프레임을 재구성합니다. 동시에 Alpha VAE Decode
(#52)는 VAELoader
(#51)와 함께 알파 채널을 재구성합니다. 두 디코더는 동일한 잠재를 읽으므로 매트는 색상 픽셀과 정확히 정렬되며, 이는 일관된 투명성을 위한 Wan‑Alpha의 설계 핵심 아이디어입니다. 이 이중 경로 디코딩이 Wan Alpha를 직접 합성 준비 상태로 만드는 것입니다.저장 및 미리보기
SavePNGZIP_and_Preview_RGBA_AnimatedWEBP
(#73)은 두 가지 전달물을 작성합니다: RGBA PNG 프레임의 zip 아카이브와 간단한 애니메이션 WebP 미리보기입니다. 프레임 시퀀스는 NLE 및 합성기에서 사용하기에 적합하며, 미리보기는 리뷰를 가속화합니다. 출력 세트를 이름짓고, 미리보기 길이 및 품질을 선택한 후 노드를 실행하여 결과를 패키징합니다.EmptyHunyuanLatentVideo
(#40)
width
, height
, frames
, fps
를 조정합니다. 더 큰 캔버스와 긴 지속 시간은 VRAM 요구 사항을 증가시킵니다; 외관 개발을 위한 짧은 초안을 고려한 후 최종을 위해 확장하세요.KSampler
(#3)
seed
를 조정하고, steps
는 속도와 디테일을 교환하며, sampler
와 scheduler
는 안정성을 위해 조정하고, cfg
는 프롬프트 준수와 자연스러운 모션을 균형 있게 합니다. LightX2V LoRA가 활성화된 경우, 품질을 유지하면서 steps
를 크게 줄일 수 있습니다. 빠른 샘플링에 대한 컨텍스트는 LightX2V를 참조하세요. ModelTC/LightX2VLoraLoaderModelOnly
(#59)
strength
제어를 사용하여 효과를 혼합합니다. 이 LoRA를 체인의 기본 모델에 가장 가깝게 유지하여 다운스트림 LoRA가 속도 이점을 상속받을 수 있도록 합니다.LoraLoaderModelOnly
(#65)
strength
를 적당히 조정하고, 프롬프트와 결합하여 대체하지 마세요. 아티팩트가 나타나면 샘플러를 변경하기 전에 이 LoRA를 낮추세요.VAELoader
(#39) RGB
RGB VAE Decode
(#8)에서 사용되는 RGB VAE를 제공합니다. Wan‑Alpha 알파 VAE와 쌍을 이루어야 두 디코더가 잠재를 일관되게 해석할 수 있습니다. 관련 없는 VAE로 교체하면 가장자리가 잘못 정렬되거나 투명성이 부드러워질 수 있습니다. RGB-알파 공동 설계에 대한 배경은 Wan‑Alpha 보고서에 있습니다. Wan‑Alpha (arXiv)VAELoader
(#51) Alpha
Alpha VAE Decode
(#52)에서 사용되는 알파 VAE를 제공합니다. RGB와 동일한 잠재 공간에서 매트를 재구성하여 투명도가 모션 및 디테일과 일치하도록 합니다. VAE를 사용자 정의하는 경우, RGB와 알파가 여전히 머리카락과 같은 서브픽셀 가장자리에서 정렬되는지 테스트하세요.SavePNGZIP_and_Preview_RGBA_AnimatedWEBP
(#73)
output_name
을 설정하고, 생성된 클립을 반영하는 미리보기 품질과 프레임 속도를 선택하며, PNG 내보내기를 손실 없는 합성을 위한 마스터로 유지합니다. 디코드와 저장 사이에 크기를 조정하지 않아 가장자리 충실도를 유지하세요.Wan Alpha에서 사용된 리소스
이 워크플로우는 다음 작품과 리소스를 구현하고 발전시켰습니다. 우리는 그들의 기여와 유지 관리를 위해 WeChatCV에 감사드립니다. 권위 있는 세부 사항은 아래에 연결된 원본 문서와 저장소를 참조하십시오.
참고: 참조된 모델, 데이터셋 및 코드는 저자와 유지 관리자가 제공한 해당 라이선스 및 약관에 따릅니다.
RunComfy는 최고의 ComfyUI 플랫폼으로서 ComfyUI 온라인 환경과 서비스를 제공하며 ComfyUI 워크플로우 멋진 비주얼을 제공합니다. RunComfy는 또한 제공합니다 AI Playground, 예술가들이 최신 AI 도구를 활용하여 놀라운 예술을 창조할 수 있도록 지원합니다.