Qwen 이미지 편집 워크플로우 in ComfyUI | 인페인팅, 재조명, 스타일 전환

ComfyUI를 위한 Qwen 이미지 편집: 프롬프트 기반 사진 편집, 교체 및 재조명

이 워크플로우는 Qwen 패밀리에 의해 구동되는 빠르고 제어 가능한 이미지 편집을 제공합니다. 단일 프롬프트로 인페인팅, 배경 교체, 객체 삽입 또는 제거 및 영화 같은 재조명을 로컬 세부사항을 보존하면서 적용할 수 있습니다. Qwen 이미지 편집은 복잡한 노드 그래프와 씨름하지 않고 정밀한 변형을 원하는 아티스트와 창작자에게 이상적입니다.

그래프는 간단한 단계로 구성되어 있습니다: 모델 로드, 이미지 업로드, 프롬프트 작성, 샘플링 및 저장. 초고속 4단계 편집을 위한 선택적 Lightning LoRA가 포함되어 있어 빠르게 반복하고 원하는 모습을 고정할 수 있습니다.

Comfyui Qwen 이미지 편집 워크플로우의 주요 모델

Qwen 이미지 편집 확산 모델 지침 기반 편집을 위한 핵심 이미지 편집 UNet. qwen_image_edit_fp8_e4m3fn.safetensors로 ComfyUI에 패키지화 되어 있으며, Comfy-Org/Qwen-Image-Edit_ComfyUI에 있습니다.
Qwen 2.5 VL 7B 텍스트 인코더 편집 지침을 해석하고 모델을 조절하는 멀티모달 텍스트 인코더. qwen_2.5_vl_7b_fp8_scaled.safetensors로 제공되며, Comfy-Org/Qwen-Image_ComfyUI에 있습니다.
Qwen 이미지 VAE Qwen 이미지 모델에 맞춘 잠재 코덱으로 재구성 품질을 향상시킵니다. qwen_image_vae.safetensors로 배포되며, Comfy-Org/Qwen-Image_ComfyUI에 있습니다.
Qwen-Image-Lightning LoRA (선택 사항) 고품질 편집을 4단계만에 가능하게 하는 속도 최적화된 LoRA. Qwen-Image-Lightning-4steps-V1.0.safetensors로 lightx2v/Qwen-Image-Lightning에 있습니다.

Comfyui Qwen 이미지 편집 워크플로우 사용 방법

Step 1 – 모델 로드

그래프는 UNETLoader (#37)로 편집 UNet을 로드하고, CLIPLoader (#38)로 텍스트 인코더를 로드하며, VAELoader (#39)로 잠재 코덱을 로드합니다. 빠른 반복을 원한다면 선택적인 LoraLoaderModelOnly (#89)를 전환하여 기본 모델 위에 Lightning LoRA를 적용하세요. ModelSamplingAuraFlow (#66) 및 CFGNorm (#75)는 샘플러를 준비하여 Qwen 이미지 편집 모델이 프롬프트를 깔끔하게 따르도록 합니다.

Step 2 – 편집할 이미지 업로드

수정할 사진을 선택하려면 LoadImage (#78)를 사용하세요. 이미지는 ImageScaleToTotalPixels (#93)를 통해 품질 친화적인 범위의 해상도를 유지하여 매우 큰 입력에서 발생할 수 있는 아티팩트를 피합니다. VAEEncode (#88)는 효율적인 편집을 위해 픽셀을 구조를 보존하면서 잠재로 변환합니다.

Step 3 – 프롬프트

TextEncodeQwenImageEdit (#76)에 긍정적 지시로 지침을 작성하세요. 예를 들어 "배경을 일몰 도시 풍경으로 교체," "뒤에 있는 사람 제거," "왼쪽에서 부드러운 황금색 키 라이트" 등이 있습니다. 두 번째 TextEncodeQwenImageEdit (#77)를 부정적 지침으로 사용하여 변경을 피해야 할 때, 예를 들어 "피사체의 얼굴을 변경하지 마세요" 또는 "재킷의 색상을 유지하세요"처럼 사용하세요. 두 인코더는 업로드된 이미지와 VAE를 모두 보며 콘텐츠와 조절이 일치하도록 합니다.

샘플링 및 출력

KSampler (#3)는 패치된 모델과 당신의 조절을 사용하여 편집을 실행합니다. Lightning LoRA가 활성화되면 매우 적은 단계로 수렴할 수 있으며, 그렇지 않으면 최대 충실도를 위해 더 많은 단계가 필요합니다. 편집된 잠재는 VAEDecode (#8)에 의해 디코딩되고 SaveImage (#60)를 통해 디스크에 기록됩니다.

Comfyui Qwen 이미지 편집 워크플로우의 주요 노드

`TextEncodeQwenImageEdit` (#76)

편집을 주도하는 주요 지시를 인코딩합니다. "교체," "삽입," "제거," "재색칠," "재조명"과 같은 직접적인 동사를 선호하세요. 변경이 국소적이어야 한다면 영역이나 객체를 명확히 명명하세요. 프롬프트는 간결하게 유지하세요; 스타일 태그의 긴 목록은 거의 필요하지 않습니다.

`TextEncodeQwenImageEdit` (#77)

부정적 또는 보호적 지침을 제공합니다. 모델이 피해야 할 것 또는 주요 속성을 보존할 것을 알려주세요. 좋은 패턴: "피부 톤 유지," "구성을 변경하지 마세요," "배경 텍스트 무시."

`LoraLoaderModelOnly` (#89)

빠른 반복을 위한 Qwen-Image-Lightning LoRA를 적용합니다. 즉각적인 결과가 필요할 때 켜세요. 이 LoRA가 활성화된 경우 샘플러 단계를 크게 줄여 선명한 편집을 유지하세요.

`ImageScaleToTotalPixels` (#93)

과대 입력을 목표 메가픽셀 예산으로 다운스케일하여 품질을 안정화합니다. 소스 이미지가 매우 크거나 압축이 심할 때 사용하세요; 이는 가장자리 부드러움을 개선하고 할로를 줄이는 경우가 많습니다.

`CFGNorm` (#75)

분류기 자유 지시 동작을 정상화하여 모델이 아티팩트를 밀어내지 않고 프롬프트를 따르도록 합니다. 과포화 또는 "과편집"이 보이면 강도를 약간 낮추세요; 편집이 소극적으로 느껴지면 약간 높이세요.

`KSampler` (#3)

확산 루프를 실행합니다. fp8에 대해 적당한 단계로 시작하고 편집이 완료되지 않은 경우에만 증가시키세요. 지시를 중간으로 유지하세요; 매우 높은 값은 보존된 영역을 씻어낼 수 있습니다. Lightning LoRA가 켜져 있을 때는 그 속도 이점을 포착하기 위해 매우 적은 단계로 사용하세요.

선택적 추가 사항

편집을 간단히 설명하세요. Qwen 이미지 편집은 "하늘을 흐리게 하고 비를 추가" 또는 "광고판 텍스트를 'RunComfy'로 흰색으로 교체"와 같은 짧고 실행 가능한 지침에 가장 잘 반응합니다.
배경 교체의 경우, 새로운 장면과 분위기를 지정하세요. 예를 들어 "배경을 황혼의 스카이라인, 주황색 안개, 희미한 도시 불빛으로 교체"처럼 하세요.
객체 작업의 경우, 행동과 위치를 결합하세요: "피사체의 오른손에 빨간 우산 삽입," 또는 "왼쪽의 쓰레기통 제거"처럼 하세요.
재조명의 경우, 방향, 품질 및 강도를 지정하세요: "카메라 오른쪽에서 부드러운 키 라이트, 미세한 림 라이트, 따뜻한 톤."
결과가 과도하게 처리된 것처럼 보이면, 지시를 낮추거나 LoRA를 비활성화하세요; 편집이 너무 약하면 단계를 약간 증가시키거나 지시를 강화하세요.

감사의 말

이 워크플로우는 다음 작업 및 리소스를 구현하고 이를 기반으로 합니다. 우리는 QwenLM의 Qwen-Image-Edit, QwenLM의 Qwen-Image, 그리고 ComfyOrg의 ComfyUI Native Workflow Example에 대해 그들의 기여와 유지보수에 감사드립니다. 권위 있는 세부사항은 아래에 링크된 원본 문서 및 리포지토리를 참조하세요.

리소스

Comfy/Qwen 이미지 편집 참조
- GitHub: QwenLM/Qwen-Image
- Hugging Face: Qwen/Qwen-Image-Edit
- arXiv: Qwen-Image 기술 보고서
- 문서 / 릴리스 노트: Qwen-Image-Edit ComfyUI Native Workflow Example

참고: 참조된 모델, 데이터셋 및 코드의 사용은 저자 및 유지 관리자가 제공한 해당 라이선스 및 조건에 따릅니다.

Want More ComfyUI Workflows?

Wan 2.2 | 오픈 소스 비디오 생성 리더

지금 이용 가능! 더 나은 정밀도 + 부드러운 모션.

Wan 2.2 + Lightx2v V2 | 초고속 I2V & T2V

듀얼 Light LoRA 설정, 4배 더 빠름.

Wan 2.2 이미지 생성 | 2-in-1 워크플로우 팩

MoE Mix + Low-Only 업스케일. 하나를 선택하세요.

Wan 2.2 Lightning T2V I2V | 4단계 초고속

Wan 2.2가 이제 20배 더 빠릅니다! 4단계에서 T2V + I2V.

Wan 2.2 Low Vram | Kijai Wrapper

낮은 VRAM. 더 이상 기다리지 마세요. Kijai 래퍼 포함.

IPAdapter Plus (V2) | 스타일과 구성

IPAdapter Plus는 1-이미지 LoRA처럼 작동하여 효과적인 스타일 및 구성 전송을 가능하게 합니다.

Dance Video Transform | 장면 맞춤화 & 얼굴 교체

장면 편집, 얼굴 교체 및 움직임 보존을 통해 댄스 비디오를 변환하세요.

Z-Image De-Turbo LoRA 추론 | AI Toolkit ComfyUI

단일 RCZimageDeturbo 사용자 지정 노드를 사용하여 ComfyUI에서 AI Toolkit에서 훈련된 Z-Image De-Turbo LoRA를 훈련 일치 동작으로 실행합니다.

팔로우하기

지원

리소스

법적 고지

RunComfy

RunComfy는 최고의 ComfyUI 플랫폼으로서 ComfyUI 온라인 환경과 서비스를 제공하며 ComfyUI 워크플로우 멋진 비주얼을 제공합니다. RunComfy는 또한 제공합니다 AI Models, 예술가들이 최신 AI 도구를 활용하여 놀라운 예술을 창조할 수 있도록 지원합니다.

Qwen 이미지 편집 | 정밀한 AI 사진 편집