Wan 2.2 Qwen 다각도 분할 스택: 하나의 사진을 동기화된 5‑각도 9:16 비디오로 변환
ComfyUI의 Wan 2.2 Qwen 다각도 분할 스택은 단일 이미지를 다섯 개의 독특한 카메라 각도로 변환하고 각각을 애니메이션으로 만든 후 깨끗한 9:16 수직 분할 스택으로 조립합니다. 그 결과는 제품 전시, 캐릭터 회전, 소셜 미디어에 적합한 동기화된 다중 관점 비디오입니다.
하나의 입력으로 여섯 가지 결과물을 얻습니다: 다섯 개의 개별 Wan 2.2 이미지-비디오 (I2V) 클립과 하나의 최종 스택 슈퍼컷입니다. 워크플로우는 의견이 있지만 유연하여 설치 세부 정보를 건드리지 않고도 프롬프트를 교체하고, 지속 시간을 조정하며, 구성을 변경할 수 있습니다.
Comfyui Wan 2.2 Qwen 다각도 분할 스택 워크플로우의 주요 모델
- Wan 2.2 이미지-비디오 디퓨전 (14B, 고-노이즈 및 저-노이즈 UNet 쌍)과 속도를 위한 선택적 LightX2V 4단계 LoRA. 이 모델은 정지를 모션으로 변환하면서 피사체의 정체성과 장면 레이아웃을 유지합니다. 출처: Comfy-Org Wan 2.2 리팩, LoRA 파일 및 VAE 자산 포함. Hugging Face
- Qwen-이미지-편집 2511은 관점 인식 이미지 편집을 위한 것입니다. 단일 입력에서 동일한 피사체의 다섯 가지 각도 변형을 생성하며, 여기서는 두 가지 LoRA로 강화되었습니다: 다중-각도 (일관된 요/피치 이동을 위해)와 Lightning 4단계 (빠르고 고품질 편집을 위해). Comfy-Org Qwen-Image-Edit • 다중-각도 LoRA • Lightning 4단계 LoRA
- Qwen 2.5-VL 7B 비전-언어 인코더. Qwen-이미지-편집을 깨끗하고 반복 가능한 각도 변경으로 유도하는 편집 프롬프트를 조건화하고 구문 분석하는 데 사용됩니다. Hugging Face
- 잠재를 디코딩하고 인코딩하는 VAE들: Wan I2V를 위한 Wan 2.1 VAE와 이미지-편집 경로를 위한 Qwen 이미지 VAE. Wan VAE • Qwen 이미지 VAE
- 스택하기 전에 매끄러움과 프레임 리듬을 통합하기 위한 RIFE 프레임 보간. 다섯 개의 클립에 걸쳐 시간적 떨림을 줄입니다. GitHub
Comfyui Wan 2.2 Qwen 다각도 분할 스택 워크플로우 사용법
전체 흐름: 하나의 이미지는 Qwen을 통해 다섯 개의 각도 일관된 스틸을 생성하고, 각 스틸은 Wan 2.2에 의해 클립으로 애니메이션화된 후, 모든 클립이 크기 조정되어 9:16 비디오로 위에서 아래로 스택됩니다.
1) 글로벌 길이/크기 로드 및 설정
LoadImage(#41)에 소스를 드롭하세요. 이게 유일한 필수 사용자 자산입니다.width(#207),height(#208),frame length(#214)를 설정하세요. 이 세 가지 정수는 다섯 개의 Wan 2.2 애니메이션을 한 번에 구동합니다.- 스태커는 나중에 각 패널을 균일한 타일로 크기 조정하므로 피사체 안정성을 위해 정사각형 I2V 렌더링을 유지하고 1080×1920 최종 스택을 얻을 수 있습니다.
2) Qwen으로 다섯 개의 다각도 스틸 생성
- 다섯 개의
QwenMultiangleCameraNode인스턴스 (#964, #984, #1022, #1041, #1060)가 입력을 분석하고 카메라 각도 프롬프트 (예: 약간 왼쪽, 프로필, 미묘한 위/아래 기울기)를 생성합니다. - 각 프롬프트는 Qwen-이미지-편집과 다중-각도 및 Lightning LoRA를 사용하여 포토리얼리스틱한 관점 변화를 렌더링하는
Qwen Generate그룹 (#962, #983, #1021, #1040, #1059)에 전달됩니다. - 애니메이션 전 각도를 빠르게 검사할 수 있도록 미리보기 이미지를 저장합니다 (
SaveImage노드 #369, #460, #534, #607, #680).
3) Wan 2.2 I2V로 각 각도 애니메이션화
- 다섯 개의
Image to Video (Wan2.2)서브그래프는 각각 편집된 스틸을start_image로 가져와 모션 클립을 생성합니다 (WanImageToVideo내부 #772, #774, #775, #837, #839). - 모든 다섯 개는 동일한 길이와 해상도를 글로벌 정수에서 공유하여 패널 간 모션과 프레이밍이 동기화됩니다.
- I2V 노드 각각에 짧은 모션 프롬프트를 제공하여 각 패널에 다른 카메라 동작을 원할 경우 지정할 수 있으며, 완벽하게 맞춘 분할 스택을 위해 정렬된 상태로 두어도 됩니다.
4) 9:16 분할 스택 구축
- 각 클립은
GetVideoComponents와RIFE VFI를 통해 프레임 리듬을 정상화한 후ResizeImageMaskNode를 통해 1080×384 타일 크기로 조정됩니다. - 타일은 Composite Stack 서브그래프 (
Composite Stack 1–5, 예: #925 → #927 → #932 → #937 → #942) 내부의ImageStitch에 의해 수직으로 연결됩니다. CreateVideo(#758)는 스택된 프레임을 조립하고SaveVideo(#759)는 최종 9:16 슈퍼컷을 저장합니다.
5) 내보낼 항목
- 개별 각도 클립은
SaveVideo(#203, #464, #537, #610, #683)에 의해 저장됩니다. - 스택된 비디오는
SaveVideo(#759)에 의해 저장됩니다. 파일 이름은 미리 채워져 있으며, 프로젝트에 맞게 변경할 수 있습니다.
Comfyui Wan 2.2 Qwen 다각도 분할 스택 워크플로우의 주요 노드
QwenMultiangleCameraNode (#964 등)
이 노드 패밀리는 단일 이미지에서 다섯 개의 각도 인식 프롬프트를 생성하며, 이는 Wan 2.2 Qwen 다각도 분할 스택 외관의 기초입니다. 이를 실행간 요/피치 변경을 표준화하는 장소로 사용하세요. 여기서 "일관된 스튜디오 조명" 또는 "중립 배경"과 같은 작은 프롬프트 추가는 Qwen-이미지-편집이 가장자리와 그림자를 안정적으로 유지하는 데 도움을 줍니다. Qwen-이미지-편집과 그 LoRA의 기능과 제약 사항은 모델 페이지를 참조하세요. Qwen-이미지-편집 • 다중-각도 LoRA
Qwen Generate (#962)
이 서브그래프는 Qwen-이미지-편집 2511을 다중-각도 및 Lightning 4단계 LoRA와 Qwen 2.5-VL 텍스트 인코더와 함께 래핑합니다. 각 카메라 지시를 깨끗하고 정체성을 보존하는 스틸로 변환합니다. 원본에 더 강하게 부착해야 하는 경우, 포함된 TextEncodeQwenImageEditPlus의 긍정적인 텍스트를 미세 조정하여 피사체 특성이나 제품 기능을 강조하세요. Lightning 4단계 • Qwen 2.5-VL 7B
WanImageToVideo (#772)
이것은 편집된 각 스틸을 모션으로 변환하는 Wan 2.2 I2V 커널입니다. 노드는 글로벌 width, height, length를 읽으며, 줌 또는 미세한 피사체 모션을 정의하기 위해 짧은 모션 프롬프트를 추가할 수 있습니다. I2V 서브그래프 내에서 4단계 LoRA를 켜면 기본 품질에 근접한 빠른 렌더링을 원할 경우 사용할 수 있으며, 최대 충실도를 선호할 경우 꺼 두세요. Wan 2.2 I2V
RIFE VFI (#926)
스태킹 전에 클립 리듬을 부드럽고 일치시키는 데 사용됩니다. 소스 모션이 조잡해 보일 경우에만 보간을 늘리세요; 높은 요인은 렌더링 시간을 증가시킵니다. RIFE는 가볍고 Wan 2.2의 고정 단계 디코딩과 잘 어울리므로 스태킹 바로 전에 위치합니다. Practical-RIFE
ImageStitch (#912)
5열 수직 패널을 구축합니다. 방향을 “아래로” 설정하여 9:16 레이아웃을 유지하세요. 다섯 개 미만의 각도를 사용할 경우, 최종 캔버스가 1080×1920을 유지하도록 업스트림 리사이즈 노드에서 타일 높이를 조정하세요.
선택적 추가 기능
- 창의적 제어: 녹색 “Create Prompt” 문자열 노드를 사용하여 스타일 노트를 한 번 추가한 후 Qwen이 모든 각도에 걸쳐 이를 일관되게 전파하도록 하세요.
- 일관성 팁: “일관된 스튜디오 조명, 중립 배경, 중심 피사체”를 요청하여 스택 전반에 걸친 변화를 최소화하세요.
- 성능: VRAM이 부족할 경우, 먼저
width와height를 낮추고, 그 다음frame length를 낮추세요. 스태커는 여전히 9:16 비디오를 출력할 것입니다. - 더 적거나 많은 패널: 각도의 하위 집합을 실행할 수 있으며, 최종 캔버스가 여전히 1080×1920이 되도록 매칭 타일 높이로 다시 스티치하세요.
- 전달물 믹스: 스택된 슈퍼컷을 소셜 피드에 공유하고 다섯 개의 개별 Wan 2.2 클립을 세부 샷, 썸네일 또는 루프로 유지하세요.
감사의 말
이 워크플로우는 다음 작품 및 리소스를 구현하고 구축합니다. 우리는 hellorob에게 Wan 2.2 Qwen 다각도 분할 스택 소스 ComfyUI 워크플로우에 대한 기여와 유지 보수에 대해 감사드립니다. 권위 있는 세부 사항은 아래에 링크된 원본 문서 및 저장소를 참조하세요.
리소스
- hellorob/Wan 2.2 Qwen 다각도 분할 스택 소스
- GitHub: Comfy-Org/workflow_templates
- 문서 / 릴리스 노트: Wan 2.2 Qwen Multiangle Split Stack Source
참고: 참조된 모델, 데이터셋 및 코드의 사용은 해당 저자 및 유지 관리자가 제공한 라이선스 및 조건에 따릅니다.
