ComfyUI에서 영상 업스케일러

ComfyUI Easy Video Upscaler for Footage Workflow

Easy Video Upscaler for Footage in ComfyUI | HD Detail Restoration

Want to run this workflow?

Fully operational workflows
No missing nodes or models
No manual setups required
Features stunning visuals

ComfyUI Easy Video Upscaler for Footage Examples

영상 업스케일러#

영상 업스케일러는 Mickmumpitz가 개발한 ComfyUI의 간소화된 파이프라인으로, 최소한의 설정으로 기존 비디오의 선명도, 질감 및 인식 해상도를 업그레이드합니다. 빠른 고해상도, 디테일 친화적인 샤프닝 및 Wan 2.x 확산 정제를 결합하여 움직임을 자연스럽게 유지하면서 세부 구조를 복원합니다. 아카이브 녹음을 현대화하거나 AI 생성 클립을 개선하거나 배달 마스터를 준비할 때, 영상 업스케일러 워크플로우는 프레임 전반의 일관성, 배치 간의 매끄러운 전환 및 신뢰할 수 있는 출력을 강조합니다.

워크플로우는 단일 입력 비디오를 수용하고, 프레임 속도를 자동으로 읽고, 안내 프롬프트를 생성하거나 수용하며, 긴 시퀀스가 원활하게 유지되도록 혼합 가능한 배치로 프레임을 처리합니다. 저 VRAM 시스템을 위한 경량 GGUF 모델 또는 최대 충실도를 위한 FP8 UNet을 선택한 다음, 간단한 창의성 컨트롤로 정제를 조정할 수 있습니다. 최종 결과는 업스케일된 비디오로 저장되며, 대형 프로젝트의 경우 선택적으로 이미지 시퀀스 경로로 저장됩니다.

ComfyUI 영상 업스케일러 워크플로우의 주요 모델#

Wan 2.2 T2V Low Noise 14B UNet (FP8 또는 GGUF). 세부 사항을 향상하면서 소스 프레임을 존중하는 확산 기반 정제를 위한 핵심 생성 백본입니다. Hugging Face: Comfy-Org/Wan_2.2_ComfyUI_Repackaged 및 Hugging Face: bullerwins/Wan2.2-T2V-A14B-GGUF
Wan 2.1 VAE. 정제 중 잠재 공간과 픽셀 공간을 이동할 때 질감과 톤을 보존하는 디코더입니다. Hugging Face: Comfy-Org/Wan_2.1_ComfyUI_repackaged
UMT5-XXL 텍스트 인코더 (FP8). WAN 모델과 지침을 정렬하는 프롬프트 조건화를 위한 텍스트 백본입니다. Wan 2.1 재패키지 자산에 포함되어 있습니다. Hugging Face: Comfy-Org/Wan_2.1_ComfyUI_repackaged
RealESRGAN x2. 확산 기반 세부 복구 전에 프레임 크기를 깔끔하게 증폭하는 고전적인 고해상도 모델입니다. GitHub: xinntao/Real-ESRGAN
Microsoft Florence-2 Large. 여기에서 대표 프레임을 자동으로 캡션하는 비전-언어 모델로, 프롬프트를 작성하지 않을 때 고품질의 프롬프트를 제공합니다. Hugging Face: microsoft/Florence-2-large
WAN 2.2를 위한 선택적 LoRA 추가 기능. 영상에 과도한 영향을 미치지 않고 특정 외관으로 정제를 유도할 수 있는 경량 어댑터입니다. 예를 들어, “Lightning” 저소음 4단계 LoRA. Hugging Face: lightx2v/Wan2.2-Lightning

ComfyUI 영상 업스케일러 워크플로우 사용 방법#

파이프라인은 입력에서 출력까지 명확한 경로를 따르며 품질, 속도 및 메모리 동작을 조정할 수 있는 그룹으로 제어를 조직합니다.

모델 로더#

이 그룹은 핵심 모델 스택을 초기화하고 Wan 2.2를 위한 FP8 safetensors UNet 또는 GGUF-양자화 UNet을 선택할 수 있게 합니다. VRAM이 부족할 때 GGUF 경로를 사용하거나 최고 충실도를 원할 때 FP8 UNet을 사용하세요. Wan 2.1 VAE 및 UMT5-XXL 텍스트 인코더는 프롬프트가 나중에 확산 단계를 안내할 수 있도록 여기에서 로드됩니다. LoRA를 사용할 계획이라면, 실행 전에 이 그룹에서 로드하세요.

입력 비디오 및 설정#

VHS_LoadVideo (#130)와 함께 소스 클립을 드롭하십시오. 워크플로우는 VHS_VideoInfo (#298)를 통해 소스 프레임 속도를 읽어 최종 렌더가 움직임 주기를 맞춥니다. 목표 너비와 높이를 설정하고, 고품질 모드를 활성화할지 여부를 선택하고, 정제가 입력에 얼마나 엄격하게 따를지를 결정하기 위해 창의성 컨트롤을 조정합니다. 긴 클립의 경우, 반복당 프레임 수와 배치가 깔끔하게 혼합될 수 있도록 중첩 값을 설정하고, 최대 안정성을 원하거나 매우 높은 해상도로 작업할 때 이미지 시퀀스 저장 옵션을 활성화하십시오.

프롬프트#

사용자 지정 프롬프트를 입력하거나 워크플로우가 하나를 작성하도록 할 수 있습니다. 단일 프레임이 Florence2Run (#147)에 의해 샘플링되고 캡션이 작성된 다음 StringReplace (#408)에 의해 가볍게 재작성되고 JoinStrings (#339)를 통해 모든 사용자 지정 텍스트와 병합됩니다. 결합된 프롬프트는 ShowText|pysssss (#135)에 의해 표시되고 Positive Prompt (#3)에 전달되며, Negative Prompt (#4)에는 아티팩트 감소 용어가 포함되어 있습니다. 이는 특히 배치 작업에서 프롬프트를 일관되고 빠르게 관리할 수 있게 합니다.

업스케일 생성#

프레임은 RealESRGAN을 사용하여 ImageUpscaleWithModel (#303)로 사전 업스케일링된 후 ImageScale (#454)로 목표 해상도에 맞게 정확히 조정됩니다. 필요할 때 Image Sharpen FS (#452)가 가장자리를 복원하고 ImageAddNoise (#421)가 확산 패스가 현실적인 미세 질감을 재구성하는 데 도움이 되는 작은 제어된 소음을 추가합니다. WAN 모델은 WanVideoNAG (#115) 및 ModelSamplingSD3 (#419)로 준비된 후 UltimateSDUpscaleNoUpscale (#126)이 전역 구조와 움직임 연속성을 존중하는 타일링된 프롬프트 기반 정제를 수행합니다.

배치 생성기 + 생성된 배치 혼합#

긴 비디오는 자동으로 혼합 가능한 배치로 분할됩니다. 이 서브그래프는 반복 횟수를 계산하고 “Number of Iterations”에 표시하며, 중첩 설정을 고려하여 각 이미지 배치를 조립합니다. 배치 간 경계에서는 ImageBatchJoinWithTransition (#244)이 프레임을 혼합하여 이음새가 눈에 띄지 않도록 합니다. 컷이 명확할 때는 중첩을 늘리고, 장면이 안정적일 때는 속도를 높이기 위해 줄이십시오.

출력 혼합 저장 이미지 시퀀스#

“Save Image Sequence”가 활성화되면 각 반복은 디스크에 프레임을 기록하며, 이는 매우 높은 해상도 또는 제한된 메모리에 유용합니다. 워크플로우는 나중에 VHS_LoadImagesPath (#396)를 사용하여 해당 프레임을 다시 로드하고, 선택적으로 배치 끝을 다시 혼합하고 연속 시퀀스로 조립합니다. 이 경로는 중지하고 처리 재개할 때 강력한 복구 경로를 제공합니다.

출력#

최종 프레임은 앞서 캡처된 소스 프레임 속도를 사용하여 VHS_VideoCombine (#128)로 비디오로 컴파일됩니다. 이미지 시퀀스를 저장한 경우, 디스크에서 렌더링하기 위해 대체 결합 노드로 전환할 수 있습니다. 이 노드에서 필요한 경우 컨테이너 및 픽셀 형식을 설정할 수도 있습니다.

ComfyUI 영상 업스케일러 워크플로우의 주요 노드#

`VHS_LoadVideo` (#130)#

입력 클립을 로드하고 이미지, 프레임 수 및 video_info 블롭을 노출합니다. 일부만 처리하려는 경우, 노드에서 프레임 로드를 제한하고 “Frames per Iteration”을 적절히 정렬하세요. 로더와 배치 설정을 동기화하면 배치를 스티칭할 때 끊김이나 간격을 방지합니다.

`ImageUpscaleWithModel` (#303)#

확산 전에 빠르고 아티팩트 저항력 있는 크기 부스트를 위해 RealESRGAN을 적용합니다. 정제 전에 목표 해상도에 도달하거나 접근하기 위해 사용하여 WAN 패스가 대규모 리사이징 대신 질감과 세부 사항에 집중할 수 있도록 하세요. 소스가 이미 목표 크기에 맞는 경우에도 이 단계를 유지하여 노이즈 제거 및 구조 강화를 수행할 수 있습니다.

`UltimateSDUpscaleNoUpscale` (#126)#

타일과 이음새 수정 및 선택적 타일 디코드를 사용하여 전역 구조를 보존하는 WAN 확산 정제를 실행합니다. 여기에서 중요한 몇 가지 제어는 샘플러 단계, 노이즈 제거 강도 및 이음새 관련 옵션입니다; 높은 단계와 노이즈 제거는 더 강력한 외관을 생성하고, 낮은 설정은 원본 프레임에 더 가깝게 유지합니다. 설정 그룹에서 고품질을 활성화하면 이 노드는 자동으로 단계 깊이를 조정합니다.

`WanVideoNAG` (#115) 및 `ModelSamplingSD3` (#419)#

이 쌍은 WAN 모델을 샘플러에 연결하고 창의성 이동을 노출합니다. 낮은 창의성은 부드러운 향상과 함께 출력을 입력에 가깝게 유지하고, 높은 값은 더 많은 생성 질감을 추가하고 세부 사항을 발명할 수 있습니다. 다큐멘터리, 인터뷰 또는 아카이브 작업의 경우 보수적인 값을 선호하고, 합성 또는 AI 기원 클립의 경우 조금 더 밀어낼 수 있습니다.

`ImageBatchJoinWithTransition` (#244)#

한 배치의 꼬리를 다음 배치의 머리와 혼합하여 스티치 마크를 숨깁니다. 명도 또는 질감 점프를 발견할 때 전환 프레임 수를 늘리고, 장면이 균일할 때는 속도를 높이기 위해 줄이십시오. 이는 긴 타임라인에서 영상 업스케일러 파이프라인을 원활하게 유지하는 주요 레버입니다.

`VHS_VideoCombine` (#128)#

상류에서 캡처된 소스 fps로 최종 비디오를 조립합니다. 이미지 시퀀스를 저장한 경우, 디스크에서 렌더링하기 위해 대체 결합 노드로 전환할 수 있습니다. 이 노드에서 필요한 경우 컨테이너 및 픽셀 형식을 설정할 수도 있습니다.

선택적 추가 기능#

하나의 WAN 경로를 선택하십시오. 강력한 GPU에서는 최고의 품질을 위해 FP8 UNet을 사용하고, 저 VRAM 워크스테이션 및 노트북에서는 GGUF UNet을 사용하십시오.
움직임을 자연스럽게 유지하십시오. 라이브 액션 또는 다큐멘터리 영상의 경우 낮은 창의성으로 시작한 다음 질감 복구가 필요할 때 점진적으로 증가하십시오.
배치를 미리 계획하십시오. 긴 클립에서는 “Save Image Sequence”를 활성화하여 확산을 재계산하지 않고도 최종 결과를 다시 렌더링하거나 재개할 수 있습니다.
프레임 수학을 맞추십시오. 반복당 프레임 수를 로더의 제한 및 중첩과 정렬되도록 설정하십시오; 영상 업스케일러 배치 도구가 반복을 계산하고 가장자리를 혼합합니다.
LoRA를 절제하여 사용하십시오. 특정 외관이 필요할 때 WAN 2.2 LoRA를 추가하고, 장면의 원래 특성을 압도하기 시작하면 가중치를 낮추십시오.

감사의 글#

이 워크플로우는 다음의 작업 및 리소스를 구현하고 구축합니다. 우리는 Mickmumpitz의 영상 업스케일러 워크플로우에 대한 기여와 유지 관리에 감사 드립니다. 권위 있는 세부 사항은 아래에 링크된 원본 문서와 저장소를 참조하십시오.

리소스#

YouTube/영상 업스케일러
- 문서 / 릴리스 노트: YouTube @ Mickmumpitz

주의: 참조된 모델, 데이터셋 및 코드의 사용은 해당 저자 및 유지 관리자가 제공한 라이선스 및 조건에 따릅니다.

Want More ComfyUI Workflows?

FlashVSR | 실시간 비디오 업스케일러

비디오를 빠르고 부드럽고 매우 선명하게 업스케일하세요—세부사항 손실 없음.

SUPIR + Foolhardy Remacri | 8K 이미지/비디오 업스케일러

SUPIR과 4x Foolhardy Remacri 모델을 사용하여 이미지를 8K로 업스케일합니다.

SUPIR | 사진 같은 이미지/비디오 업스케일러

SUPIR은 사진 같은 이미지 복원을 가능하게 하고, SDXL 모델과 함께 작동하며, 텍스트 프롬프트 개선을 지원합니다.

CCSR | 일관된 이미지/비디오 업스케일러

CCSR 모델은 콘텐츠 일관성에 더 중점을 두어 이미지 및 비디오 업스케일링을 개선합니다.

APISR | 애니메이션 이미지/비디오 업스케일러

APISR 모델은 애니메이션 이미지와 비디오를 향상시키고 복원하여 시각적 요소를 더욱 생생하고 선명하게 만듭니다.

Wan 2.1 Control LoRA | 깊이 및 타일

경량의 깊이 및 타일 LoRA로 구조와 세부 사항을 개선하여 Wan 2.1 비디오 생성 발전.

업샘플링을 통한 일관된 스타일 전환

업샘플링으로 잠재적 노이즈를 제어하면 비디오 스타일 전환의 일관성이 크게 향상됩니다.

FLUX LoRA (RealismLoRA) | 사실적인 이미지

FLUX-1 모델과 FLUX-RealismLoRA를 결합하여 사실적인 AI 이미지를 제작하세요.

팔로우하기

지원

리소스

법적 고지

RunComfy

RunComfy는 최고의 ComfyUI 플랫폼으로서 ComfyUI 온라인 환경과 서비스를 제공하며 ComfyUI 워크플로우 멋진 비주얼을 제공합니다. RunComfy는 또한 제공합니다 AI Models, 예술가들이 최신 AI 도구를 활용하여 놀라운 예술을 창조할 수 있도록 지원합니다.

영상 업스케일러 | 전문 HD 향상