WAN 2.2 원활한 워크플로우 v5.0: 매끄러운 5초 비디오를 위한 올인원 ComfyUI 파이프라인#
WAN 2.2 원활한 워크플로우 v5.0은 텍스트‑투‑비디오, 이미지‑투‑비디오, 첫 프레임‑투‑마지막 프레임 애니메이션, 오디오‑투‑비디오를 포괄하는 단일 캔버스입니다. SmoothMix WAN 2.2 모델 패밀리를 중심으로, 선택적 Lightx2v LoRAs, WAN 2.x용 WanVideoWrapper 연산자, RIFE 프레임 보간을 기반으로 구축되어 일관된 움직임과 빠른 반복으로 짧은 시네마틱 클립을 생성할 수 있습니다.
WAN 2.2 원활한 워크플로우 v5.0을 사용하여 T2V, I2V, F2LF, A2V 간에 노드를 재배선하지 않고 전환할 수 있는 정리된 그래프를 사용할 수 있습니다. 캔버스에는 모드 전환, 지속 시간 및 크기 제어, 마지막 프레임 미리보기, 클립의 시각적 리듬을 따르는 선택적 오디오 분기 등이 포함되어 있습니다.
Comfyui WAN 2.2 원활한 워크플로우 v5.0의 주요 모델#
- SmoothMix WAN 2.2 텍스트‑투‑비디오 및 이미지‑투‑비디오 체크포인트 (고해상도 및 저해상도)
- 역할: T2V 및 I2V 경로 전반에 걸쳐 모션 합성 및 정제를 위한 주요 확산 백본. 고해상도는 품질과 세부 사항을 선호하고, 저해상도는 속도와 VRAM 공간을 선호합니다.
- Lightx2v WAN 2.2 Distill LoRAs
- 역할: WAN 2.2를 위한 선택적 LoRAs로, 움직임의 부드러움이나 스타일화를 향상시키면서 프롬프트에 반응성을 유지합니다. 외관과 다이내믹스를 조정하려면 필요에 따라 로드합니다. lightx2v/Wan2.2-Distill-Loras
- WAN 2.x VAE
- 역할: 캔버스 전반에 걸쳐 비디오 잠재 변수를 인코딩하고 디코딩하여 이미지 품질과 색상 반응을 일관되게 유지합니다.
- WAN 2.x 텍스트 인코더 (uMT5 XXL 패밀리)
- 역할: WAN 2.x에서 사용하는 특화된 텍스트 인코더로, 워크플로우는 일치하는 토크나이저/모델을 로드하여 프롬프트가 모션과 외관을 적절히 조건화하도록 합니다.
- CLIP 비전 인코더 (ViT‑H 패밀리)
- 역할: 첫 프레임‑투‑마지막 프레임 애니메이션 경로를 위한 강력한 시작 및 종료 프레임 임베딩을 추출하여 보간 중 시간적 일관성을 개선합니다.
- 오디오 생성 분기
- 역할: 시각적 타이밍과 텍스트 프롬프트에 조건화된 프레임 인식 오디오 합성을 통해 시각적 컷과 일치하는 사운드트랙 요소를 생성합니다.
- RIFE 비디오 보간
- 역할: 고품질 중간 프레임을 삽입하여 시간적 부드러움과 명백한 프레임 속도를 증가시킴으로써 짧은 시네마틱 루프에 이상적입니다. ComfyUI VFI 통합을 통해 사용됩니다. GACLove/ComfyUI-VFI
Comfyui WAN 2.2 원활한 워크플로우 v5.0 사용 방법#
캔버스는 캔버스 스위치에서 활성화할 수 있는 네 가지 제작 모드로 구성되어 있습니다. 모드 전반에 걸쳐 체크포인트, CLIP/VAE, 프롬프트, 비디오 크기 및 길이, 샘플링, 비디오 결과에 대한 일관된 그룹을 볼 수 있습니다. 각 모드는 오디오 생성이 가능하도록 오디오 활성화 전환을 사용할 수 있습니다.
텍스트를 비디오로 (T2V)#
긍정적 프롬프트에 설명을 입력하고 부정적 프롬프트로 정제하세요. 프롬프트 텍스트는 CLIPTextEncode (#90)에서 인코딩되고 WAN 2.x VAE와 결합됩니다. WanImageToVideo (#50)는 시작 이미지 없이도 T2V 진입점으로 작동하여 샘플러로 전달된 초기 잠재 시퀀스를 생성한 후 디코딩합니다. RIFE 보간 RIFEInterpolation (#160)은 시퀀스를 매끄럽게 한 후 VHS_VideoCombine (#77)이 MP4로 내보냅니다. 오디오 활성화를 사용하여 프레임과 오디오 프롬프트에서 사운드트랙을 생성하세요.
이미지를 비디오로 (I2V)#
IMAGE 그룹에 단일 이미지를 드롭한 후 비디오 치수와 지속 시간을 설정합니다. 이미지는 크기가 조정되어 텍스트 프롬프트와 함께 WanImageToVideo (#172)에 전달되어 모션 인식 잠재 변수를 생성합니다. 페어드 샘플러는 잠재 변수를 정제하고, 결과는 디코딩, 업스케일링, 보간되어 매끄러운 출력을 제공합니다. 애니메이션 콘텐츠에 맞는 생성된 사운드를 원하면 I2V 오디오 그룹을 활성화하세요.
첫 프레임에서 마지막 프레임 애니메이션 (F2LF)#
시작 프레임과 종료 프레임을 제공합니다. 그래프는 CLIP 비전으로 둘 다 인코딩하고 WanFirstLastFrameToVideo (#343)에 전달하여 첫 번째 이미지와 마지막 이미지 사이의 경로를 계획하면서 텍스트 프롬프트를 존중합니다. 고해상도 및 저해상도 SmoothMix 샘플러는 디코딩 및 보간 전에 중간 프레임을 조각합니다. 결과는 VHS_VideoCombine (#332)에 의해 내보내지며, 선택적 오디오 분기는 시각적 전환에 맞춘 사운드트랙을 합성할 수 있습니다.
오디오를 비디오로 (A2V)#
기존 클립을 VHS_LoadVideo (#145)에 로드합니다. 워크플로우는 추가 부드러움을 위해 선택적으로 보간할 수 있으며, 그 후 오디오 분기는 비주얼과 오디오 프롬프트를 기반으로 사운드를 생성합니다. VHS_VideoCombine (#148)은 트랙을 혼합하고 새 파일을 내보냅니다. 캔버스의 마지막 프레임 미리보기를 사용하여 내보내기 전에 시각적 일관성을 빠르게 확인하세요.
내보내기 및 마지막 프레임 미리보기#
각 모드는 VideoHelperSuite의 VHS_VideoCombine 노드를 통해 MP4를 작성하는 비디오 결과 그룹으로 종료됩니다. 전용 마지막 프레임 창은 조명, 색상, 주제 품질을 전체 생성 실행 전에 한눈에 판단할 수 있도록 최종 프레임을 저장하고 미리 봅니다. 비디오 I/O 및 미리보기 기능은 VideoHelperSuite에 의해 제공됩니다. pythongosssss/ComfyUI-VideoHelperSuite
Comfyui WAN 2.2 원활한 워크플로우 v5.0의 주요 노드#
WanImageToVideo (#50)
- T2V 및 I2V를 위한 WAN 2.x 비디오 진입점으로, WanVideoWrapper 내부에서 작동합니다. 프롬프트를 VAE (및 선택적 시작 이미지)와 결합하여 초기 모션 잠재 변수를 구축합니다. 상류의 크기 및 길이 제어는 모델 친화적인 제약을 존중해야 하며, 이 노드는 그 이후의 페어드 샘플러에 공급됩니다. WanVideoWrapper 구현 세부 사항 및 업데이트는 여기에서 유지됩니다: kijai/ComfyUI-WanVideoWrapper.
WanFirstLastFrameToVideo (#343)
- CLIP 비전 임베딩을 경계 프레임과 함께 텍스트 프롬프트를 수용하여 첫 프레임‑투‑마지막 프레임 경로를 구동합니다. 대상을 향해 변형되는 동안 주제 정체성과 장면 레이아웃을 보존하는 안내된 궤적을 생성합니다. 가장 자연스러운 전환을 위해 주제의 비율 및 구성이 일치하는 시작 및 종료 프레임을 유지하세요.
KSamplerWithNAG (Advanced) (#234)
- 노이즈 보조 가이드를 적용하여 프롬프트 준수를 개선하고 짧은 클립에서 시간적 드리프트를 줄입니다. 과도한 제약 또는 제약 부족을 볼 때만 가이드를 조정하세요; 표준 샘플러 및 부정적 프롬프트와 함께 작동합니다. 방법 및 조정 가이드는 프로젝트 문서에서 확인하세요: scottmudge/ComfyUI-NAG.
RIFEInterpolation (#160)
- 비디오로 인코딩하기 전에 모션 부드러움을 개선하기 위해 고품질 중간 프레임을 삽입합니다. 기본 시퀀스가 프레임 간에 좋은 것으로 보이지만 재생 시 약간 끊기는 느낌이 들 때 사용하세요. 이 노드는 ComfyUI VFI 확장이 제공하는 RIFE 구현을 통합합니다. GACLove/ComfyUI-VFI
VHS_VideoCombine (#77)
- 최종 인코딩, 선택적 오디오 혼합, 메타데이터 저장을 처리합니다. 프로젝트 전반에 걸쳐 예측 가능한 재생을 위해 형식 및 픽셀 형식을 일관되게 유지하세요. VideoHelperSuite는 캔버스의 다른 곳에서 사용되는 빠른 마지막 프레임 미리보기 유틸리티도 지원합니다. pythongosssss/ComfyUI-VideoHelperSuite
선택적 추가 기능#
- 품질과 속도의 균형을 맞추기 위해 고해상도 및 저해상도 SmoothMix 체크포인트를 사용하세요. 고해상도는 히어로 샷 및 마지막 반복에 이상적이며, 저해상도는 프롬프트 및 타이밍에 대한 빠른 반복을 돕습니다.
- 아티팩트를 최소화하고 샘플링 속도를 높이기 위해 모델 친화적인 배수로 비디오 폭과 높이를 유지하세요.
- T2V 클립이 정적처럼 보이면 시드를 새로 고치거나 샘플링 깊이를 늘리기 전에 프롬프트에 모션 동사를 강화하세요.
- F2LF의 경우, 유사한 카메라 각도와 노출로 경계 프레임을 선택하세요. 구성이 크게 변동하면 부드럽게 해결하기 어려워집니다.
- 캔버스에는 수동 프롬프트 재작성 없이 빠른 변형을 원할 때 더 풍부한 구문을 위한 적응형 프롬프트 도우미가 포함되어 있습니다. Alectriciti/comfyui-adaptiveprompts
이 WAN 2.2 원활한 워크플로우 v5.0은 모드 전환 마찰을 최소화하면서 결과를 부드럽고 시네마틱하게 유지하도록 설계되었습니다. 입력에 맞는 모드로 시작하여 크기와 지속 시간을 설정하고 명확한 프롬프트 쌍을 작성한 후 샘플러와 RIFE가 나머지를 처리하도록 하세요.
감사의 말#
이 워크플로우는 다음 작품 및 리소스를 구현하고 기반으로 합니다. Smooth Workflow Wan 2.2 AIO 워크플로우와 Smooth Mix Wan 2.2 14B I2V/T2V 모델을 위한 Civitai 제작자, ComfyUI-WanVideoWrapper의 kijai, Wan2.2-Distill-Loras를 위한 ModelTC의 lightx2v에 감사드립니다. 권위 있는 세부 사항은 아래에 링크된 원본 문서 및 저장소를 참조하세요.
리소스#
- Civitai/Smooth Workflow Wan 2.2 AIO (워크플로우 v5.0)
- 문서 / 릴리스 노트: Workflow source
- Civitai/Smooth Mix Wan 2.2 14B (I2V/T2V)
- 문서 / 릴리스 노트: SmoothMix WAN 2.2 I2V/T2V models
- kijai/ComfyUI-WanVideoWrapper
- GitHub: kijai/ComfyUI-WanVideoWrapper
- lightx2v/Wan2.2-Distill-Loras
- GitHub: ModelTC/LightX2V
- Hugging Face: lightx2v/Wan2.2-Distill-Loras
참고: 참조된 모델, 데이터셋 및 코드는 작성자 및 유지관리자가 제공하는 해당 라이센스 및 조건에 따라 사용해야 합니다.


