Wan 2.1 | 혁신적인 비디오 생성
Wan 2.1은 비디오 생성 벤치마크에서 모든 경쟁자를 능가합니다. 1.3B 모델은 8.19GB VRAM만 필요하며, 일반 하드웨어에서 4분 만에 480P 비디오를 생성하는 Text-to-Video 및 Image-to-Video 워크플로우를 지원합니다. Wan 2.1 14B 모델은 RunComfy의 클라우드를 통해 향상된 720P 품질을 제공합니다. 비디오에서 중국어와 영어 텍스트를 모두 생성하는 최초의 모델로서 Wan 2.1은 창의적인 옵션을 확장하며, Wan-VAE 백엔드는 1080P 비디오 처리를 시간적 일관성을 유지하며 효율적으로 처리합니다.ComfyUI Wan 2.1 워크플로우
ComfyUI Wan 2.1 예제
ComfyUI Wan 2.1 설명
ComfyUI Wan 2.1 워크플로우 설명
1. Wan 2.1이란?
ComfyUI Wan 2.1 워크플로우는 최신 Wan 2.1 모델을 활용하여 텍스트 프롬프트 또는/및 기본 이미지를 통해 고품질 비디오를 생성하는 최첨단 비디오 생성 파이프라인입니다. Wan 2.1은 Text-to-Video (T2V) 및 Image-to-Video (I2V) 생성을 지원하며, 자연스러운 움직임과 전문가급 품질의 5초 비디오를 생성합니다. Wan 2.1은 AI 비디오 생성의 새로운 벤치마크를 설정하며, 오픈 소스 및 상업적 대안을 능가합니다. Wan 2.1 14B 모델은 720P까지 뛰어난 결과를 제공합니다.
2. Wan 2.1의 이점 및 기능
- 고품질 출력: 현실적인 움직임과 고충실도의 질감을 가진 480P에서 720P 비디오를 생성합니다.
- 하드웨어 접근성: 경량 Wan 2.1 1.3B 모델은 8.19GB VRAM만 필요하여 대부분의 현대 GPU와 호환됩니다 (여기서 RunComfy가 제공합니다!).
- 다재다능한 생성: Wan 2.1은 Text-to-Video (T2V) 및 Image-to-Video (I2V) 워크플로우를 모두 지원합니다.
- 다국어 지원: Wan 2.1은 비디오 내에서 중국어와 영어 텍스트를 모두 생성할 수 있는 첫 번째 비디오 모델입니다.
- VAE 효율성: Wan-VAE 백엔드는 시간적 일관성을 유지하면서 1080P 비디오를 효율적으로 처리합니다.
- 빠른 처리: Wan 2.1 1.3B 모델은 품질을 유지하면서 빠른 결과를 제공합니다.
3. Wan 2.1 사용 방법
3.1 Wan 2.1 생성 방법
기본 Wan 2.1 생성 방법 (기본적으로 비활성화됨): Text-to-Video
- 입력: 텍스트 프롬프트
- 가장 적합한 용도: 텍스트 설명을 사용하여 비디오를 처음부터 생성
- 특징:
- 빠른 생성을 위한 Wan 2.1 1.3B 모델 사용
- 480P 해상도의 33프레임 (5초) 비디오 생성
- 짧은 클립에서 매끄러운 움직임을 최적화
고급 Wan 2.1 방법 (기본적으로 활성화됨): 텍스트 프롬프트가 포함된 Image-to-Video
- 입력: 기본 이미지 + 텍스트 프롬프트
- 가장 적합한 용도: 프롬프트로 움직임을 안내하며 정지 이미지를 애니메이션화
- 특징:
- 입력 이미지의 시각적 요소 보존
- 움직임 방향에 대한 텍스트 제어 허용
- 더 높은 충실도를 위한 Wan 2.1 14B 모델 사용
- 512x512 해상도의 33프레임 비디오 생성
워크플로우 예시:
- CLIPTextEncode (Positive Prompt / Negative Prompt): 장면 설명 입력 (예: "a fox moving quickly in a beautiful winter landscape with trees and mountains during daytime, tracking camera").
- Load Image: 기본 이미지 업로드.
- 추가 정제 (선택 사항):
- KSampler:
steps
(기본값: 30) 조정하여 품질과 속도의 균형 조정. - ModelSamplingSD3: 프롬프트 준수를 위해
scale
값 조정 (기본값: 8).
- KSampler:
- Queue Prompt 클릭하여 생성 시작.
- SaveAnimatedWEBP에서 출력 미리보기 찾기 (ComfyUI > Output 폴더에 저장됨).
3.2 Wan 2.1의 매개변수 참조
- KSampler:
steps
: 20-30 (높은 값은 품질을 향상하지만 시간이 증가함)cfg
: 6.0 (프롬프트 준수 강도 제어)scheduler
: "simple" (노이즈 스케줄링 접근 방식 결정)sampler_name
: "uni_pc" (Wan 2.1에 권장되는 샘플러)
- WanImageToVideo:
width/height
: 512 (출력 해상도)length
: 33 (비디오당 프레임 수)batch_size
: 1 (실행당 비디오 수)
- ModelSamplingSD3:
scale
: 8 (가이던스 준수 제어)
- EmptyHunyuanLatentVideo:
width/height
: 832/480 (T2V 출력 해상도)length
: 33 (비디오당 프레임 수)batch_size
: 1 (실행당 비디오 수)
3.3 Wan 2.1의 고급 최적화
- 메모리 최적화:
- 낮은 VRAM 요구 사항으로 빠른 생성을 위해 Wan 2.1 1.3B 모델 사용.
- 더 빠른 처리를 위해 해상도 감소 (예: 512x320).
- 짧고 빠른 렌더링을 위해 프레임 수 감소.
- 품질 최적화:
- 더 높은 품질 출력을 위해 Wan 2.1 14B 모델 사용.
- 더 정제된 결과를 위해 KSampler 단계를 30-40으로 증가.
- 최고의 충실도를 위해 고품질 기본 이미지를 사용한 Image-to-Video 활용.
더 많은 정보
Wan 2.1에 대한 추가 정보는 를 방문하세요.
크레딧
Wan 2.1 모델은 Wan 팀에 의해 개발되었으며, ComfyUI 통합은 원작자에 의해 만들어졌습니다. AI 기반 비디오 생성의 발전을 위해 이러한 혁신자들에게 모든 공로를 돌립니다.