FireRed 圖像編輯 1.0 ComfyUI 工作流程
FireRed 圖像編輯 1.0 是一個通用的、遵循指令的圖像編輯工作流程,適用於 ComfyUI,提供高保真度的結果和強烈的視覺一致性。它支持單圖和多圖編輯,如物件替換、背景更換、保留風格的精修、文本風格保留、照片恢復和虛擬試穿。該圖表設計用於在 RunComfy 和類似的托管設置上快速迭代,具有清晰的模型選擇、分辨率和採樣控制。
如果您是需要從自然語言指令中進行精確編輯的創作者、設計師或研究人員,此 FireRed 圖像編輯工作流程允許您將純文本指引與一到三個參考圖像結合,指導複雜的轉換,同時保持身份、佈局和風格不變。
ComfyUI FireRed 圖像編輯工作流程中的關鍵模型
- FireRed-Image-Edit-1.0。執行遵循指令編輯的基礎擴散模型,具有強烈的視覺一致性。提供高精度 BF16 和適合受限硬體的量化變體。Model card
- FireRed-Image-Edit-1.0 GGUF。一個量化的 UNet 版本,優化為 CPU 或低 VRAM 推理,保留基礎 FireRed 圖像編輯權重的行為,內存佔用減少。Weights
- Qwen2.5-VL 7B 文本編碼器 (FP8, Comfy-packaged)。提供多模態文本圖像嵌入,將您的指令轉化為 FireRed 圖像編輯可遵循的條件。Files
- Qwen Image VAE。編碼和解碼與 FireRed 圖像編輯管道兼容的潛變量,在重建過程中保留細節。Files
- Qwen-Image-Edit-2511-Lightning LoRA。一個可選的 LoRA,將基礎模型適應於快速、步驟有效的推理,同時保持編輯意圖清晰。當您想要快速預覽或更快速的 FireRed 圖像編輯迭代循環時使用。Model
如何使用 ComfyUI FireRed 圖像編輯工作流程
在高層次上,您選擇模型變體,載入一到三個參考圖像,撰寫命名這些圖像的指令,設置目標分辨率,然後進行採樣和保存。畫布中的組反映了這個流程,因此您可以從上到下工作而不必尋找節點。
模型
此組讓您選擇與您的硬體和速度需求匹配的 FireRed 圖像編輯後端。圖表包括一個高質量的 BF16 UNet 和一個 GGUF 量化 UNet,通過 Any Switch (rgthree) (#91) 連接,您可以在它們之間切換。LoraLoaderModelOnly (#74) 可選地應用 Qwen-Image-Edit-2511-Lightning LoRA 以加速預覽。然後,模型準備好進行採樣和指導正規化,以穩定地遵循指令。
提示
您的指令使用兩個 TextEncodeQwenImageEditPlus 節點進行正面和負面指導編碼。在提示中明確地將您的已載入圖像稱為“image 1”、“image 2”和“image 3”,以控制 FireRed 圖像編輯如何使用每個參考。例如,您可以要求將 image 1 作為主題,將其放置在 image 2 的背景上,並從 image 3 中轉移服裝或風格。使用負面提示來指出要避免的內容,例如不需要的物件、色彩變化或文本更改。
輸入
在輸入區域載入您的來源:image 1 通常是主要主題,image 2 是替代背景或上下文,image 3 是風格或服裝參考。您可以處理單個圖像或組合兩個或三個進行多圖編輯。圖表通過 GetImageSize 讀取 image 1 的尺寸,因此您可以在需要時自動匹配分辨率。圖像傳遞給正面和負面編碼器,以便您的指令可以一致地利用它們。
Image2
當您想要不同的背景、照明或佈局時使用此插槽。在您的正面指令中,描述放置方式以及應使用多少 image 2。負面指導可以防止完整場景替換,如果您只想要部分合成。FireRed 圖像編輯將對齊主題邊界,同時保留主題的外觀。
Image3
用於風格或物件轉移的此插槽,例如虛擬試穿或配件交換。命名要轉移的確切屬性,例如“來自 image 3 的紅色夾克”或“來自 image 3 的筆觸風格”。這使 FireRed 圖像編輯的條件集中,防止當您只想更改一個元素時進行全局風格化。
擴散模型
此視圖顯示 BF16 FireRed 圖像編輯 UNet。選擇它以獲得最佳細節保真度和最穩定的複雜指令執行。它是現代 GPU 上的推薦路徑。如果您在更大分辨率下遇到內存限制,請考慮 GGUF 路徑。
GGUF
此視圖顯示為 CPU 或低 VRAM 設備優化的 GGUF 量化 FireRed 圖像編輯 UNet。大多數編輯的品質保持強勁,內存使用顯著減少。它非常適合在普通硬體上或運行多個工作者時進行可批處理、可重現的渲染。
採樣
採樣塊將您的正面和負面條件與潛變量畫布結合起來,並產生最終的編輯。EmptySD3LatentImage (#116) 設置目標分辨率和批量大小,然後 KSampler (#65) 使用您選擇的調度器和種子運行步驟。VAEDecode 將潛變量轉換為圖像以供預覽,SaveImage 將文件寫入您的 ComfyUI 輸出目錄。固定種子以實現可重現性,或變化它以探索尊重您的指令的替代方案。
選項
使用模型選擇器區域在 BF16 和 GGUF 變體之間切換而不需要重新連接。分辨率選擇器可以自動匹配 image 1 或使用自定義圖像尺寸組。這些控制存在以保持 FireRed 圖像編輯流程快速,讓您根據工作調整成本、速度和質量。
自定義圖像尺寸
當您想要明確控制時,兩個整數小部件設置寬度和高度。此路徑為潛變量生成器提供信息,因此整個運行都尊重您選擇的尺寸。為了獲得 FireRed 圖像編輯的最佳細節,請選擇接近您的主要主題或背景圖像的縱橫比的分辨率,以減少重採樣工件。
ComfyUI FireRed 圖像編輯工作流程中的關鍵節點
Any Switch (rgthree) (#91)
在不更改下游接線的情況下,將圖表路由通過 BF16 FireRed 圖像編輯 UNet 或 GGUF 變體。使用它來 A/B 質量和速度,或通過同一圖表將 CPU 和 GPU 工作者路由。項目鏈接:rgthree/rgthree-comfy
LoraLoaderModelOnly (#74)
在選擇的 FireRed 圖像編輯模型上應用 Qwen-Image-Edit-2511-Lightning LoRA。當您想要在較低步驟中更快的預覽時增加強度,如果您注意到過度強勢的更改則減少它。在創意階段保持啟用,然後在最終、最高保真度渲染時禁用或減弱。模型鏈接:lightx2v/Qwen-Image-Edit-2511-Lightning
TextEncodeQwenImageEditPlus (Positive) (#68)
將您的指令轉換為條件,同時攝取最多三個參考圖像。撰寫直接、明確的命令,並明確引用圖像編號以進行合成、屬性轉移或佈局約束。您的名詞和動詞越具體,FireRed 圖像編輯就越能可靠地遵循它們。
TextEncodeQwenImageEditPlus (Negative) (#69)
讓您禁止不需要的工件、偏離風格或不需要的更改。使用它來保留字體設計、品牌色彩或身份,即使主要指令推動了強烈的轉換。與明確的正面相結合,以平衡創造力和保護。
EmptySD3LatentImage (#116)
在您選擇的分辨率下創建潛變量畫布。匹配 image 1 的尺寸以獲得忠實的合成,或設置自定義分辨率以輸出到打印或特定的縱橫比。考慮在編輯後進行適度的放大,而不是在極高分辨率下編輯。
KSampler (#65)
推動實現您指令的去噪過程。調整步驟、調度器和種子以平衡速度和保真度。啟用 Lightning LoRA 時,較少的步驟通常足以獲得強烈的預覽,而使用更保守設置的 BF16 路徑則適合最終版本。核心節點參考:ComfyUI
可選附加功能
- 為了快速迭代,從 GGUF 路徑加上 Lightning LoRA 開始,然後切換到 BF16 進行最終版本。
- 撰寫命名來源的提示,例如:“將 image 1 的主題放置在 image 2 的背景上,並從 image 3 轉移夾克,保持光照一致。”
- 使用負面提示保護品牌色彩、標誌或文本,當使用 FireRed 圖像編輯處理產品照時。
- 自動匹配分辨率到 image 1 以進行合成,或者在您替換整個背景時設置自定義尺寸。
- 固定種子在比較 BF16 和 GGUF 輸出時,使差異反映模型選擇而非隨機性。
致謝
此工作流程實現並基於以下作品和資源。我們對 @eyeforailabs 和 FireRedTeam 的 FireRed-Image-Edit-1.0 及 EyeForAILabs 的 YouTube 教程的貢獻和維護表示由衷感謝。欲了解權威細節,請參閱下方鏈接的原始文檔和存儲庫。
資源
- FireRedTeam/FireRed-Image-Edit-1.0
- GitHub: FireRedTeam/FireRed-Image-Edit
- Hugging Face: FireRedTeam/FireRed-Image-Edit-1.0
- EyeForAILabs/YouTube Tutorial
- Docs / Release Notes: @eyeforailabs YouTube Tutorial
注意:使用引用的模型、數據集和代碼需遵循其作者和維護者提供的各自許可和條款。
