이 워크플로우는 Qwen 패밀리에 의해 구동되는 빠르고 제어 가능한 이미지 편집을 제공합니다. 단일 프롬프트로 인페인팅, 배경 교체, 객체 삽입 또는 제거 및 영화 같은 재조명을 로컬 세부사항을 보존하면서 적용할 수 있습니다. Qwen 이미지 편집은 복잡한 노드 그래프와 씨름하지 않고 정밀한 변형을 원하는 아티스트와 창작자에게 이상적입니다.
그래프는 간단한 단계로 구성되어 있습니다: 모델 로드, 이미지 업로드, 프롬프트 작성, 샘플링 및 저장. 초고속 4단계 편집을 위한 선택적 Lightning LoRA가 포함되어 있어 빠르게 반복하고 원하는 모습을 고정할 수 있습니다.
qwen_image_edit_fp8_e4m3fn.safetensors
로 ComfyUI에 패키지화 되어 있으며, 에 있습니다.qwen_2.5_vl_7b_fp8_scaled.safetensors
로 제공되며, 에 있습니다.qwen_image_vae.safetensors
로 배포되며, 에 있습니다.Qwen-Image-Lightning-4steps-V1.0.safetensors
로 에 있습니다.그래프는 UNETLoader
(#37)로 편집 UNet을 로드하고, CLIPLoader
(#38)로 텍스트 인코더를 로드하며, VAELoader
(#39)로 잠재 코덱을 로드합니다. 빠른 반복을 원한다면 선택적인 LoraLoaderModelOnly
(#89)를 전환하여 기본 모델 위에 Lightning LoRA를 적용하세요. ModelSamplingAuraFlow
(#66) 및 CFGNorm
(#75)는 샘플러를 준비하여 Qwen 이미지 편집 모델이 프롬프트를 깔끔하게 따르도록 합니다.
수정할 사진을 선택하려면 LoadImage
(#78)를 사용하세요. 이미지는 ImageScaleToTotalPixels
(#93)를 통해 품질 친화적인 범위의 해상도를 유지하여 매우 큰 입력에서 발생할 수 있는 아티팩트를 피합니다. VAEEncode
(#88)는 효율적인 편집을 위해 픽셀을 구조를 보존하면서 잠재로 변환합니다.
TextEncodeQwenImageEdit
(#76)에 긍정적 지시로 지침을 작성하세요. 예를 들어 "배경을 일몰 도시 풍경으로 교체," "뒤에 있는 사람 제거," "왼쪽에서 부드러운 황금색 키 라이트" 등이 있습니다. 두 번째 TextEncodeQwenImageEdit
(#77)를 부정적 지침으로 사용하여 변경을 피해야 할 때, 예를 들어 "피사체의 얼굴을 변경하지 마세요" 또는 "재킷의 색상을 유지하세요"처럼 사용하세요. 두 인코더는 업로드된 이미지와 VAE를 모두 보며 콘텐츠와 조절이 일치하도록 합니다.
KSampler
(#3)는 패치된 모델과 당신의 조절을 사용하여 편집을 실행합니다. Lightning LoRA가 활성화되면 매우 적은 단계로 수렴할 수 있으며, 그렇지 않으면 최대 충실도를 위해 더 많은 단계가 필요합니다. 편집된 잠재는 VAEDecode
(#8)에 의해 디코딩되고 SaveImage
(#60)를 통해 디스크에 기록됩니다.
TextEncodeQwenImageEdit
(#76)편집을 주도하는 주요 지시를 인코딩합니다. "교체," "삽입," "제거," "재색칠," "재조명"과 같은 직접적인 동사를 선호하세요. 변경이 국소적이어야 한다면 영역이나 객체를 명확히 명명하세요. 프롬프트는 간결하게 유지하세요; 스타일 태그의 긴 목록은 거의 필요하지 않습니다.
TextEncodeQwenImageEdit
(#77)부정적 또는 보호적 지침을 제공합니다. 모델이 피해야 할 것 또는 주요 속성을 보존할 것을 알려주세요. 좋은 패턴: "피부 톤 유지," "구성을 변경하지 마세요," "배경 텍스트 무시."
LoraLoaderModelOnly
(#89)빠른 반복을 위한 Qwen-Image-Lightning LoRA를 적용합니다. 즉각적인 결과가 필요할 때 켜세요. 이 LoRA가 활성화된 경우 샘플러 단계를 크게 줄여 선명한 편집을 유지하세요.
ImageScaleToTotalPixels
(#93)과대 입력을 목표 메가픽셀 예산으로 다운스케일하여 품질을 안정화합니다. 소스 이미지가 매우 크거나 압축이 심할 때 사용하세요; 이는 가장자리 부드러움을 개선하고 할로를 줄이는 경우가 많습니다.
CFGNorm
(#75)분류기 자유 지시 동작을 정상화하여 모델이 아티팩트를 밀어내지 않고 프롬프트를 따르도록 합니다. 과포화 또는 "과편집"이 보이면 강도를 약간 낮추세요; 편집이 소극적으로 느껴지면 약간 높이세요.
KSampler
(#3)확산 루프를 실행합니다. fp8에 대해 적당한 단계로 시작하고 편집이 완료되지 않은 경우에만 증가시키세요. 지시를 중간으로 유지하세요; 매우 높은 값은 보존된 영역을 씻어낼 수 있습니다. Lightning LoRA가 켜져 있을 때는 그 속도 이점을 포착하기 위해 매우 적은 단계로 사용하세요.
이 워크플로우는 다음 작업 및 리소스를 구현하고 이를 기반으로 합니다. 우리는 QwenLM의 Qwen-Image-Edit, QwenLM의 Qwen-Image, 그리고 ComfyOrg의 ComfyUI Native Workflow Example에 대해 그들의 기여와 유지보수에 감사드립니다. 권위 있는 세부사항은 아래에 링크된 원본 문서 및 리포지토리를 참조하세요.
참고: 참조된 모델, 데이터셋 및 코드의 사용은 저자 및 유지 관리자가 제공한 해당 라이선스 및 조건에 따릅니다.
RunComfy는 최고의 ComfyUI 플랫폼으로서 ComfyUI 온라인 환경과 서비스를 제공하며 ComfyUI 워크플로우 멋진 비주얼을 제공합니다. RunComfy는 또한 제공합니다 AI Playground, 예술가들이 최신 AI 도구를 활용하여 놀라운 예술을 창조할 수 있도록 지원합니다.