영상 업스케일러는 Mickmumpitz가 개발한 ComfyUI의 간소화된 파이프라인으로, 최소한의 설정으로 기존 비디오의 선명도, 질감 및 인식 해상도를 업그레이드합니다. 빠른 고해상도, 디테일 친화적인 샤프닝 및 Wan 2.x 확산 정제를 결합하여 움직임을 자연스럽게 유지하면서 세부 구조를 복원합니다. 아카이브 녹음을 현대화하거나 AI 생성 클립을 개선하거나 배달 마스터를 준비할 때, 영상 업스케일러 워크플로우는 프레임 전반의 일관성, 배치 간의 매끄러운 전환 및 신뢰할 수 있는 출력을 강조합니다.
워크플로우는 단일 입력 비디오를 수용하고, 프레임 속도를 자동으로 읽고, 안내 프롬프트를 생성하거나 수용하며, 긴 시퀀스가 원활하게 유지되도록 혼합 가능한 배치로 프레임을 처리합니다. 저 VRAM 시스템을 위한 경량 GGUF 모델 또는 최대 충실도를 위한 FP8 UNet을 선택한 다음, 간단한 창의성 컨트롤로 정제를 조정할 수 있습니다. 최종 결과는 업스케일된 비디오로 저장되며, 대형 프로젝트의 경우 선택적으로 이미지 시퀀스 경로로 저장됩니다.
파이프라인은 입력에서 출력까지 명확한 경로를 따르며 품질, 속도 및 메모리 동작을 조정할 수 있는 그룹으로 제어를 조직합니다.
이 그룹은 핵심 모델 스택을 초기화하고 Wan 2.2를 위한 FP8 safetensors UNet 또는 GGUF-양자화 UNet을 선택할 수 있게 합니다. VRAM이 부족할 때 GGUF 경로를 사용하거나 최고 충실도를 원할 때 FP8 UNet을 사용하세요. Wan 2.1 VAE 및 UMT5-XXL 텍스트 인코더는 프롬프트가 나중에 확산 단계를 안내할 수 있도록 여기에서 로드됩니다. LoRA를 사용할 계획이라면, 실행 전에 이 그룹에서 로드하세요.
VHS_LoadVideo (#130)와 함께 소스 클립을 드롭하십시오. 워크플로우는 VHS_VideoInfo (#298)를 통해 소스 프레임 속도를 읽어 최종 렌더가 움직임 주기를 맞춥니다. 목표 너비와 높이를 설정하고, 고품질 모드를 활성화할지 여부를 선택하고, 정제가 입력에 얼마나 엄격하게 따를지를 결정하기 위해 창의성 컨트롤을 조정합니다. 긴 클립의 경우, 반복당 프레임 수와 배치가 깔끔하게 혼합될 수 있도록 중첩 값을 설정하고, 최대 안정성을 원하거나 매우 높은 해상도로 작업할 때 이미지 시퀀스 저장 옵션을 활성화하십시오.
사용자 지정 프롬프트를 입력하거나 워크플로우가 하나를 작성하도록 할 수 있습니다. 단일 프레임이 Florence2Run (#147)에 의해 샘플링되고 캡션이 작성된 다음 StringReplace (#408)에 의해 가볍게 재작성되고 JoinStrings (#339)를 통해 모든 사용자 지정 텍스트와 병합됩니다. 결합된 프롬프트는 ShowText|pysssss (#135)에 의해 표시되고 Positive Prompt (#3)에 전달되며, Negative Prompt (#4)에는 아티팩트 감소 용어가 포함되어 있습니다. 이는 특히 배치 작업에서 프롬프트를 일관되고 빠르게 관리할 수 있게 합니다.
프레임은 RealESRGAN을 사용하여 ImageUpscaleWithModel (#303)로 사전 업스케일링된 후 ImageScale (#454)로 목표 해상도에 맞게 정확히 조정됩니다. 필요할 때 Image Sharpen FS (#452)가 가장자리를 복원하고 ImageAddNoise (#421)가 확산 패스가 현실적인 미세 질감을 재구성하는 데 도움이 되는 작은 제어된 소음을 추가합니다. WAN 모델은 WanVideoNAG (#115) 및 ModelSamplingSD3 (#419)로 준비된 후 UltimateSDUpscaleNoUpscale (#126)이 전역 구조와 움직임 연속성을 존중하는 타일링된 프롬프트 기반 정제를 수행합니다.
긴 비디오는 자동으로 혼합 가능한 배치로 분할됩니다. 이 서브그래프는 반복 횟수를 계산하고 “Number of Iterations”에 표시하며, 중첩 설정을 고려하여 각 이미지 배치를 조립합니다. 배치 간 경계에서는 ImageBatchJoinWithTransition (#244)이 프레임을 혼합하여 이음새가 눈에 띄지 않도록 합니다. 컷이 명확할 때는 중첩을 늘리고, 장면이 안정적일 때는 속도를 높이기 위해 줄이십시오.
“Save Image Sequence”가 활성화되면 각 반복은 디스크에 프레임을 기록하며, 이는 매우 높은 해상도 또는 제한된 메모리에 유용합니다. 워크플로우는 나중에 VHS_LoadImagesPath (#396)를 사용하여 해당 프레임을 다시 로드하고, 선택적으로 배치 끝을 다시 혼합하고 연속 시퀀스로 조립합니다. 이 경로는 중지하고 처리 재개할 때 강력한 복구 경로를 제공합니다.
최종 프레임은 앞서 캡처된 소스 프레임 속도를 사용하여 VHS_VideoCombine (#128)로 비디오로 컴파일됩니다. 이미지 시퀀스를 저장한 경우, 디스크에서 렌더링하기 위해 대체 결합 노드로 전환할 수 있습니다. 이 노드에서 필요한 경우 컨테이너 및 픽셀 형식을 설정할 수도 있습니다.
VHS_LoadVideo (#130)입력 클립을 로드하고 이미지, 프레임 수 및 video_info 블롭을 노출합니다. 일부만 처리하려는 경우, 노드에서 프레임 로드를 제한하고 “Frames per Iteration”을 적절히 정렬하세요. 로더와 배치 설정을 동기화하면 배치를 스티칭할 때 끊김이나 간격을 방지합니다.
ImageUpscaleWithModel (#303)확산 전에 빠르고 아티팩트 저항력 있는 크기 부스트를 위해 RealESRGAN을 적용합니다. 정제 전에 목표 해상도에 도달하거나 접근하기 위해 사용하여 WAN 패스가 대규모 리사이징 대신 질감과 세부 사항에 집중할 수 있도록 하세요. 소스가 이미 목표 크기에 맞는 경우에도 이 단계를 유지하여 노이즈 제거 및 구조 강화를 수행할 수 있습니다.
UltimateSDUpscaleNoUpscale (#126)타일과 이음새 수정 및 선택적 타일 디코드를 사용하여 전역 구조를 보존하는 WAN 확산 정제를 실행합니다. 여기에서 중요한 몇 가지 제어는 샘플러 단계, 노이즈 제거 강도 및 이음새 관련 옵션입니다; 높은 단계와 노이즈 제거는 더 강력한 외관을 생성하고, 낮은 설정은 원본 프레임에 더 가깝게 유지합니다. 설정 그룹에서 고품질을 활성화하면 이 노드는 자동으로 단계 깊이를 조정합니다.
WanVideoNAG (#115) 및 ModelSamplingSD3 (#419)이 쌍은 WAN 모델을 샘플러에 연결하고 창의성 이동을 노출합니다. 낮은 창의성은 부드러운 향상과 함께 출력을 입력에 가깝게 유지하고, 높은 값은 더 많은 생성 질감을 추가하고 세부 사항을 발명할 수 있습니다. 다큐멘터리, 인터뷰 또는 아카이브 작업의 경우 보수적인 값을 선호하고, 합성 또는 AI 기원 클립의 경우 조금 더 밀어낼 수 있습니다.
ImageBatchJoinWithTransition (#244)한 배치의 꼬리를 다음 배치의 머리와 혼합하여 스티치 마크를 숨깁니다. 명도 또는 질감 점프를 발견할 때 전환 프레임 수를 늘리고, 장면이 균일할 때는 속도를 높이기 위해 줄이십시오. 이는 긴 타임라인에서 영상 업스케일러 파이프라인을 원활하게 유지하는 주요 레버입니다.
VHS_VideoCombine (#128)상류에서 캡처된 소스 fps로 최종 비디오를 조립합니다. 이미지 시퀀스를 저장한 경우, 디스크에서 렌더링하기 위해 대체 결합 노드로 전환할 수 있습니다. 이 노드에서 필요한 경우 컨테이너 및 픽셀 형식을 설정할 수도 있습니다.
이 워크플로우는 다음의 작업 및 리소스를 구현하고 구축합니다. 우리는 Mickmumpitz의 영상 업스케일러 워크플로우에 대한 기여와 유지 관리에 감사 드립니다. 권위 있는 세부 사항은 아래에 링크된 원본 문서와 저장소를 참조하십시오.
주의: 참조된 모델, 데이터셋 및 코드의 사용은 해당 저자 및 유지 관리자가 제공한 라이선스 및 조건에 따릅니다.
RunComfy는 최고의 ComfyUI 플랫폼으로서 ComfyUI 온라인 환경과 서비스를 제공하며 ComfyUI 워크플로우 멋진 비주얼을 제공합니다. RunComfy는 또한 제공합니다 AI Playground, 예술가들이 최신 AI 도구를 활용하여 놀라운 예술을 창조할 수 있도록 지원합니다.