FireRed 이미지 편집 1.1: ComfyUI에서 빠르고 지시 기반의 이미지 편집
FireRed 이미지 편집 1.1은 목표 지향적인 지시 기반 이미지 편집을 위한 ComfyUI 워크플로우입니다. 소스 이미지와 자연어 지시를 제공하면 구성과 정체성을 유지하면서 정확한 변경을 적용합니다. 이는 FireRed 이미지 편집 1.1 확산 변환기에 의해 구동되며, Qwen2.5-VL 7B 비전-언어 인코더에 의해 안내되어 이미지가 보여주는 것과 프롬프트가 의도하는 것을 따릅니다.
워크플로우는 또한 Lightning LoRA 터보 모드를 포함하여 빠른 반복을 위해 추론 단계를 대폭 줄입니다. 의상 변경, 스타일 전환, 장면 조정 또는 미세한 세부 조정을 위해 FireRed 이미지 편집 1.1을 사용하세요.
ComfyUI FireRed 이미지 편집 1.1 워크플로우의 주요 모델
- FireRed 이미지 편집 1.1 확산 변환기. 지시를 따르는 이미지 편집을 전문으로 하는 핵심 생성기; 프롬프트와 소스 이미지 모두에 조건을 두어 레이아웃과 정체성을 유지합니다. 모델 카드
- FireRed 이미지 편집 1.0 Lightning LoRA (8단계). 터보 모드를 가능하게 하는 경량 가속 어댑터로, 샘플링 단계를 줄여 강력한 편집 준수를 가진 빠른 미리 보기를 제공합니다. 모델 카드
- Qwen2.5-VL 7B. 여기서 인코더로 사용되어 이미지 내용과 함께 지시를 해석하여 편집 제어를 위한 강력한 조건을 생성합니다. 모델 카드
- Qwen 이미지 VAE. 소스 이미지를 편집을 위해 잠재 상태로 인코딩하고 최종 결과를 다시 픽셀로 디코딩하는 이미지 오토인코더. FireRed 1.0 자산에 포함되어 있습니다. 파일
ComfyUI FireRed 이미지 편집 1.1 워크플로우 사용 방법
간략히 보면, 워크플로우는 소스 이미지를 로드하고, 잠재 상태로 인코딩하고, Qwen2.5-VL 7B로 지시에서 조건을 빌드한 다음, FireRed 이미지 편집 1.1을 샘플러를 통해 실행하여 편집된 이미지를 생성합니다. 단일 터보 토글로 Lightning LoRA가 활성화되는지 제어하며, 이는 속도나 품질을 위한 단계 수와 가이드 강도를 전환합니다.
모델
이 그룹은 FireRed 이미지 편집 1.1 확산 변환기를 로드하고 선택적으로 Lightning LoRA를 주입합니다. 터보가 활성화되면 LoRA가 기본 모델에 적용되어 샘플링을 가속화합니다. 모델 샘플링 노드는 FireRed 변환기에 맞춘 일정을 구성하여 편집이 안정적으로 유지되도록 합니다. 가이드 정상화 단계는 프롬프트 전반에 걸쳐 일관된 조건을 준비합니다.
프롬프트
이 그룹은 FireRed 이미지 편집 1.1을 구동하는 지시를 작성하는 곳입니다. Qwen2.5-VL 7B 인코더는 소스 이미지와 함께 텍스트를 읽어 둘 다 이해합니다. 최대 두 개의 참조 이미지를 추가하여 스타일, 의상, 조명 또는 기타 속성을 유도할 수 있습니다. 워크플로우에는 부수적인 인코더 경로도 포함되어 있어 출력이 깨끗하고 목표에 맞게 유지됩니다.
이미지 인코드
소스 이미지는 모델 친화적인 해상도로 자동 조정된 후 VAE 잠재 공간으로 인코딩됩니다. 이 잠재 공간은 이미지-이미지 편집의 시작점이 되어 FireRed 이미지 편집 1.1이 구성, 카메라 기하학 및 정체성을 보존할 수 있게 합니다. 인코딩된 잠재 공간은 샘플러로 직접 흐르며 편집이 적용됩니다.
단계 설정
이 그룹은 터보 토글에 따라 샘플러 단계 수를 전환합니다. 터보가 켜져 있을 때는 빠른 미리 보기를 위해 단계가 최소로 유지되며, 터보가 꺼져 있을 때는 최대 충실도를 위해 더 높은 단계 수가 사용됩니다. 터보를 사용하여 방향을 빠르게 탐색한 다음, 최종 최고 품질의 렌더링을 위해 비활성화하세요.
CFG 설정
분류기-프리 가이드 강도도 동일한 터보 토글에 의해 전환됩니다. 낮은 가이드 값은 터보 모드와 짝을 이루어 적은 단계에서 편집을 안정적으로 유지하며, 높은 값은 전체 모델과 함께 사용되어 프롬프트 준수를 강화합니다. 워크플로우는 이를 자동으로 연결하여 매개변수를 세밀히 관리하기보다는 지시에 집중할 수 있게 합니다.
샘플러 설정
샘플러는 패치된 FireRed 모델, 긍정 및 부정 조건, 인코딩된 잠재 공간을 결합하여 편집된 이미지를 생성합니다. 결과를 반복 가능하게 하려면 시드를 설정하거나 대안을 탐색하려면 변경할 수 있습니다. 디코딩된 이미지는 출력 폴더에 명확한 접두어와 함께 저장되어 반복을 쉽게 배치하고 비교할 수 있습니다.
ComfyUI FireRed 이미지 편집 1.1 워크플로우의 주요 노드
TextEncodeQwenImageEditPlus (Positive) (#118)
이 노드는 자연어 편집 지시와 최대 3개의 이미지를 FireRed 이미지 편집 1.1에 대한 조건으로 변환합니다. “재킷을 빨간 가죽으로 바꾸고 은색 지퍼를 달아주세요” 또는 “수채화 스타일로 부드러운 가장자리로 변환하세요”와 같은 간결하고 지시적인 문구를 사용하세요. 선택적 image2 및 image3은 스타일, 의상 또는 조명 참조를 고정할 수 있으며, 목표와 시각적으로 일관되게 유지하세요. 편집이 너무 강하면 설명 강도를 줄이거나 명확한 제약을 추가하세요.
Enable Lightning LoRA? (#153)
이 토글은 Lightning LoRA 터보 경로를 활성화합니다. 활성화되면 워크플로우는 모델을 LoRA-보강 버전으로 전환하고 샘플링을 약 40단계에서 약 8단계로 줄이며, 높은 속도에서 결과를 안정적으로 유지하기 위해 가이드를 낮춥니다. 프롬프트와 참조를 빠르게 반복하는 데 사용한 후, 최종 최고 품질 출력을 위해 비활성화하세요.
LoraLoaderModelOnly (#151)
이 노드는 FireRed 이미지 편집 1.0 Lightning LoRA를 기본 FireRed 이미지 편집 1.1 모델에 주입합니다. LoRA 강도를 조정할 경우, 더 높은 값은 편집 강도를 증가시키지만 스타일을 초과하거나 아티팩트를 유발할 수 있음을 기억하세요. 정체성에 중요한 편집의 경우 강도를 적당히 유지하고 명확한 지시나 추가 참조 이미지를 사용하는 것이 좋습니다.
KSampler (#130)
샘플러는 편집 강도, 가이드 및 단계가 결합되는 곳입니다. 터보가 꺼져 있을 때 단계를 증가시키면 세부 사항이 개선되고 사소한 아티팩트가 줄어듭니다; 터보가 켜져 있을 때는 속도를 위해 단계 수를 적게 유지하고 프롬프트 명확성과 참조에 의존하세요. cfg를 신중하게 조정하세요: 높은 값은 지시를 강조하고, 낮은 값은 소스 이미지에 대한 충실도를 우선시합니다. 주요 장면 변경을 위해 cfg를 높이고 단계를 고려하세요; 미세한 조정을 위해 cfg를 낮추고 적은 단계로 정체성을 보존하세요.
선택적 추가 사항
- 전체 이미지 설명보다는 명확한 지시로 편집을 작성하세요. “티셔츠를 네이비 블레이저로 교체하고 포즈와 조명을 유지하세요”가 긴 설명보다 성능이 뛰어납니다.
- 스타일이나 의상 세부 사항을 고정하기 위해 선택적
image2및image3입력을 사용하세요. 소스와 카메라 각도 및 프레이밍을 맞춰 최상의 전환을 얻으세요. - 아이디어를 탐색하기 위해 터보를 켜고 시작한 후, 터보를 비활성화하여 최종화하세요. 높은 단계 수와 강한 가이드로 인해 약간의 차이를 기대하세요.
- 최대 정체성 보존을 위해
cfg를 보수적으로 유지하고, 짧고 구체적인 지시를 사용하며, 가능하면 근접한 참조 이미지를 제공하세요. - 방향이 마음에 들면 고정된 시드를 저장하여 실행 간 지시나 참조 이미지만 A/B 테스트하세요.
리소스
- FireRed 이미지 편집 1.1 모델: FireRedTeam/FireRed-Image-Edit-1.1-ComfyUI
- Lightning LoRA 및 VAE 자산: FireRedTeam/FireRed-Image-Edit-1.0-ComfyUI
- Qwen2.5-VL 7B 인코더: Qwen/Qwen2.5-VL-7B-Instruct
- ComfyUI 프로젝트 (노드 참조): comfy-org/ComfyUI
감사의 글
이 워크플로우는 다음 작업과 리소스를 구현하고 기반으로 합니다. 우리는 FireRedTeam의 FireRed 이미지 편집 1.1 확산 모델, FireRedTeam의 FireRed 이미지 편집 1.0 Lightning LoRA, Comfy.org의 Comfy.org 공식 워크플로우에 대한 기여와 유지보수에 감사드립니다. 권위 있는 세부 사항은 아래에 연결된 원본 문서 및 저장소를 참조하시기 바랍니다.
리소스
- FireRedTeam/FireRed 이미지 편집 1.1 확산 모델
- GitHub: FireRedTeam/FireRed-Image-Edit
- Hugging Face: FireRedTeam/FireRed-Image-Edit-1.1-ComfyUI
- arXiv: 2602.13344
- FireRedTeam/FireRed 이미지 편집 1.0 Lightning LoRA
- GitHub: FireRedTeam/FireRed-Image-Edit
- Hugging Face: FireRedTeam/FireRed-Image-Edit-1.0-ComfyUI
- arXiv: 2602.13344
- Comfy.org/Comfy.org 공식 워크플로우
- GitHub: Comfy-Org/workflow_templates
- 문서 / 릴리즈 노트: FireRed 이미지 편집 1.1: 이미지 편집
참고: 참조된 모델, 데이터셋 및 코드의 사용은 저자 및 유지 보수자가 제공한 해당 라이선스 및 약관에 따릅니다.
