LongCat Image Edit Turbo: ComfyUI에서 빠른 프롬프트 기반 이미지 편집#
LongCat Image Edit Turbo는 주제와 구성을 유지하면서 빠르고 프롬프트 기반으로 편집할 수 있는 목적에 맞춰 설계된 ComfyUI 워크플로우입니다. LongCat Image Edit Turbo 모델을 Qwen2.5-VL 조건 및 AE VAE와 결합하여 캐릭터 스타일링, 마스크와 같은 지역적 변화 및 영화적 조명 조정을 빠르고 반복 가능한 루프에서 제공합니다.
창작자와 파워 유저를 위해 설계된 이 LongCat Image Edit Turbo 그래프는 모든 소스 이미지를 수용하고 비전-언어 인코더를 통해 편집 의도를 해석하며 원본 프레이밍을 유지하는 고충실도 결과를 반환합니다. RunComfy-ready 상태로 빠른 미리보기와 제어된 정제를 위해 최적화되어 있습니다.
Comfyui LongCat Image Edit Turbo 워크플로우의 주요 모델#
- LongCat Image Edit Turbo (bf16). 빠르고 구성 보존 이미지 편집을 지원하는 확산 모델로 텍스트 지침에 강하게 반응합니다. 모델 파일
- Qwen2.5-VL 7B 텍스트 인코더 (FP8 스케일, ComfyUI 패키지). 입력 이미지의 프롬프트와 시각적 컨텍스트를 이해하여 풍부한 조건을 생성합니다. 인코더 파일
- AE VAE (ae.safetensors). 샘플링 후 LongCat Image Edit Turbo가 세부 사항을 보존할 수 있도록 저손실로 잠재에서 이미지를 재구성합니다. VAE 파일
Comfyui LongCat Image Edit Turbo 워크플로우 사용 방법#
워크플로우는 이미지와 프롬프트에서 디코딩된 결과로의 명확한 경로를 따릅니다. 단계는 편집을 빠르고 안정적으로 유지하는 몇 가지 결정적인 구성 요소를 중심으로 구성됩니다.
소스 이미지 로드 및 준비#
LoadImage(#79)를 사용하여 사진을 가져옵니다. 그래프는 편집의 견고성을 위해 스케일을 표준화하는FluxKontextImageScale(#64)을 통해 라우팅합니다.- 그런 다음 이미지는
GetImageSize(#72) 및EmptyLatentImage(#61)를 통해 작업 캔버스를 설정하여 LongCat Image Edit Turbo가 구성 및 주제 배치를 유지하도록 돕습니다. - 이 준비는 후속 편집이 전체 재합성보다는 스마트하고 마스크와 같은 조정처럼 작동하도록 보장합니다.
Qwen으로 편집 의도 인코딩#
- 워크플로우는
CLIPLoader(#19)를 사용하여 Qwen2.5-VL 인코더를 로드합니다. TextEncodeQwenImageEditPlus (Positive)(#53)에서 원하는 변경 사항을 설명합니다. LongCat Image Edit Turbo가 적용할 스타일, 조명 또는 속성 단서를 명확히 사용합니다.TextEncodeQwenImageEditPlus (Negative)(#54)를 사용하여 피하거나 보호할 요소를 나열하여 정체성과 원치 않는 변경을 방지합니다.- 인코더는 텍스트와 소스 이미지를 모두 읽고 원본 장면에 변화를 고정시키는 편집 인식 조건을 생성합니다.
가이드 조형 및 참조 혼합#
FluxGuidance(#21) 및FluxGuidance(#22)는 긍정적 및 부정적 지침이 결과에 얼마나 강하게 영향을 미치는지를 조정합니다. 강조를 높이면 대담한 편집을 추진하고, 낮추면 미세하고 구성 안전한 조정을 선호합니다.FluxKontextMultiReferenceLatentMethod(#51) 및FluxKontextMultiReferenceLatentMethod(#52)는 여러 참조가 혼합되는 방식을 제어합니다. 기본적으로 "사용하지 말고 우회"라고 표시된 보조 그래프는 비활성 상태로 유지되며, 추가 스타일 또는 속성 참조를 원할 경우 자체 이미지 로더로 교체하십시오.
샘플러 실행#
- LongCat Image Edit Turbo UNet은
UNETLoader(#18)에 의해 로드되고CFGNorm(#23)을 사용하여 안정적인 가이던스가 되도록 표준화됩니다. KSampler(#27)는 실제 확산 단계를 수행하여 의도와 컨텍스트를 새로운 잠재로 변환합니다. 미리보기를 위해 빠른 반복으로 시작한 후, 최종 품질을 위해 프롬프트 또는 가이던스 강도를 조정하십시오.- 편집을 한 번에 하나의 명확한 목표에 집중하여 가장 예측 가능한 결과를 얻으십시오.
디코드 및 내보내기#
- AE VAE는
VAELoader(#20)로 가져오고VAEDecode(#25)를 사용하여 샘플링된 잠재에서 이미지를 고충실도로 재구성합니다. SaveImage(#9)는 결과를 출력 디렉토리에 명확한 접두사로 기록하여 실행 간 변형을 쉽게 추적할 수 있게 합니다.
Comfyui LongCat Image Edit Turbo 워크플로우의 주요 노드#
TextEncodeQwenImageEditPlus (Positive)(#53). Qwen2.5-VL과 소스 이미지를 사용하여 원하는 변경을 편집 인식 조건으로 변환합니다. LongCat Image Edit Turbo가 장면을 벗어나지 않도록 주제와 원하는 변경(예: 의상, 분위기, 조명, 재질 등)에 대한 프롬프트를 집중하십시오.TextEncodeQwenImageEditPlus (Negative)(#54). 피해야 할 것을 명시하여 정체성과 구성을 보호합니다. 장면을 일관되게 유지하면서 아티팩트를 줄이거나 원치 않는 스타일링을 방지하는 데 사용하십시오.FluxGuidance(#21). 긍정적 지침이 편집을 얼마나 강하게 추진하는지를 조정합니다. 더 강한 스타일링이나 극적인 조명을 위해 증가시키고, 더 많은 원래 모습을 유지하려면 감소시키십시오. 프롬프트의 세부 사항과 제공하는 참조의 수와 균형을 맞추십시오.FluxKontextMultiReferenceLatentMethod(#51). 여러 참조가 조건에 혼합되는 방식을 결정합니다. 목표에 맞는 방법을 선택하십시오. 예를 들어 스타일 전송을 위해 강한 융합을 선택하거나 속성 조정에는 가벼운 영향을 선택하십시오.CFGNorm(#23). 다양한 설정에서 변화가 일관되게 유지되도록 가이던스 동작을 표준화합니다. LongCat Image Edit Turbo가 프롬프트를 반복하거나 샘플러를 전환할 때 안정성을 유지하도록 도와줍니다.KSampler(#27). 생성의 중심입니다. 빠르게 반복하고, 재현성을 위해 시드를 고정하고, 방향이 마음에 들면 다른 샘플러로 실험하십시오.FluxGuidance와 함께 편집 강도와 원본 충실도 간의 균형을 조정합니다.FluxKontextImageScale(#64). 다운스트림 노드를 위한 입력 이미지를 준비하고 스케일링합니다. 이 단계는 편집을 통해 프레이밍과 비율을 안정적으로 유지하는 데 중요합니다.
선택적 추가 사항#
- 더 많은 참조 추가. 다중 이미지 가이던스를 원할 경우, 우회된 보조 그래프를 자체
LoadImage노드로 교체하고 Qwen 인코드 노드의 추가 참조 입력에 연결하십시오. 이는 포즈와 레이아웃을 유지하면서 스타일 또는 의상 전송에 유용합니다. - 빠른 반복 팁. 간결한 프롬프트로 시작하고 빠른 미리보기를 실행한 다음 워딩이나 가이던스 강도를 정제합니다. 좋아하는 모습을 재현하고 작은 변형을 분기하기 위해 시드를 사용하십시오.
- 워딩으로 국부적 변경. "재킷만 빨간색으로 변경" 또는 "주제에 부드러운 림 라이트"와 같이 명확히 목표를 지정하여 명시적 마스크가 필요 없이 마스크와 같은 편집을 유도하십시오.
- GGUF 변형. CPU 또는 매우 낮은 VRAM 시나리오에서는
UnetLoaderGGUF(#77)를 사용하여 양자화된 LongCat Image Edit Turbo 가중치로 전환할 수 있습니다. 사용 가능한 양자화는 GGUF 팩을 참조하십시오. 모델 변형
감사의 글#
이 워크플로우는 다음 작품과 자원을 구현하고 확장합니다. LongCat Image Edit Turbo 및 관련 구성 요소에 대해 Comfy-Org에 감사드리며, LongCat Image Edit Turbo GGUF 모델에 대해 vantagewithai에 감사드리며, LongCat Image Edit Turbo 워크플로우에 대해 Civitai 커뮤니티에 그들의 기여와 유지에 감사드립니다. 권위 있는 세부 사항은 아래에 링크된 원본 문서 및 저장소를 참조하십시오.
자원#
- Civitai/Civitai 워크플로우 소스
- 문서 / 릴리스 노트: Civitai 모델 페이지
- Comfy-Org/LongCat Image Edit Turbo bf16 모델
- Hugging Face: Comfy-Org/LongCat-Image
- vantagewithai/LongCat Image Edit Turbo GGUF 모델
- Hugging Face: vantagewithai/LongCat-Image-Edit-Turbo-GGUF
- Comfy-Org/Qwen 2.5 VL 텍스트 인코더
- Hugging Face: Comfy-Org/Qwen-Image_ComfyUI
- Comfy-Org/AE VAE
- Hugging Face: Comfy-Org/z_image_turbo
참고: 참조된 모델, 데이터세트 및 코드의 사용은 해당 저자 및 유지관리자가 제공한 라이선스 및 조건에 따릅니다.









