Qwen Image Edit 2511 for ComfyUI:基於指令的單一圖像編輯和多圖像參考
此工作流程將 Qwen Image Edit 2511 帶到 ComfyUI,用於精確的基於指令的編輯,保持源圖像的結構和身份。它支持單一圖像編輯和多圖像參考使用案例,實現風格轉移、材料或對象替換、屬性更改,以及自然、一致的視覺增強。
基於視覺語言編碼器和擴散變換器,該圖將簡單的英語指令轉換為一致的圖像編輯。可選的 Lightning LoRA 使 Qwen Image Edit 2511 的生成快速而不犧牲對齊,讓藝術家和產品團隊能夠快速迭代創意圖像編輯、角色重新設計和專業內容精修。
想要更簡單的無節點體驗?嘗試 Playground 版本來探索 Qwen Image Edit 2511 Playground 而不需要使用 ComfyUI 節點——只需上傳圖像並用文本指令編輯。
ComfyUI Qwen Image Edit 2511 工作流程中的關鍵模型
- Qwen‑Image‑Edit‑2511。核心擴散變換器,用於編輯,改進了 2509 的一致性,設計用於遵循指令,同時保持身份和幾何穩定。Hugging Face: Qwen/Qwen-Image-Edit-2511
- Qwen2.5‑VL‑7B‑Instruct。視覺語言編碼器,作為文本/圖像理解的骨幹;它將您的指令與視覺上下文對齊,用於基於指令的編輯。Hugging Face: Qwen/Qwen2.5-VL-7B-Instruct
- Qwen Image VAE。匹配的變分自編碼器,將像素空間和模型的潛在空間映射,用於忠實重建。(文件通過 Comfy‑Org 包提供。)Hugging Face: Comfy-Org/Qwen-Image_ComfyUI
- Qwen‑Image‑Edit‑2511‑Lightning(可選)。4 步加速 LoRA,顯著加速取樣器,同時保持編輯在指令範圍內;在需要快速預覽或接近實時單圖像編輯時啟用。Hugging Face: lightx2v/Qwen-Image-Edit-2511-Lightning
如何使用 ComfyUI Qwen Image Edit 2511 工作流程
此圖包含兩個平行軌道:「多圖像」用於跨圖像屬性/材料轉移,「單圖像」用於直接基於指令的編輯。兩個軌道共享相同的模型加載器和取樣器邏輯,並都以預覽和保存節點結束。選擇與您的任務匹配的軌道,寫下明確的指令,然後排隊運行。
多圖像 › 加載圖像
使用此組加載兩個參考圖像:第一個是您的編輯基礎,第二個提供要轉移的外觀、材料或屬性。圖像自動調整為平衡的工作尺寸,以保持佈局並避免擴散過程中的偽影。選擇視角或觀點相似的參考圖像可以提高對齊度。此路徑支持的任務如「替換左側圖像中椅子的材料為右側圖像中的材料」,同時保持形狀和結構。
多圖像 › 提示
撰寫簡短明確的指令,描述編輯目標以及第二個圖像如何影響第一個圖像。例如:「將圖 1 的椅子材料替換為圖 2 的皮革,保持框架不變,匹配照明。」指令被送入 Qwen2.5‑VL 編碼器,將文本錨定在加載的視覺上,以實現可靠的圖像編輯。避免沖突的目標;指定必須保持不變的內容以獲得身份安全的結果。
多圖像 › 加載模型
此組加載 Qwen Image Edit 2511 擴散模型、Qwen2.5‑VL 編碼器和 Qwen Image VAE。您可以選擇啟用 Lightning LoRA 來加速編輯,同時保持指令的強健性。除非有理由更換變體,否則保持模板提供的模型選擇。
多圖像 › KSampler 和輸出
取樣器執行受控擴散以實現所請求的編輯,使用來自指令的正向條件和歸零的負向條件以減少非預期更改。結果由 VAE 解碼,並自動與參考圖像合併以進行並排預覽,使其易於驗證單圖像編輯是否遵循了您的指令。根據需要保存合成圖像或僅保存編輯圖像。
單圖像 › 加載圖像
拖放一個要編輯的源圖像。一個縮放階段將其準備到目標工作尺寸,以使組成保持穩定,小細節保持銳利。這是基於指令的編輯的最乾淨路徑,當您不需要風格或材料捐贈者圖像時。
單圖像 › 提示
撰寫直接指令,命名主題和具體更改。好的模式包括「保持 X,改變 Y」、「增強 Z」或「以相同組成重新設計為 [風格]」。指令與視覺上下文由編碼器融合,因此擴散模型可以應用精確的單圖像編輯,同時保持身份和幾何。
單圖像 › 加載模型
模型加載器初始化 Qwen Image Edit 2511、Qwen2.5‑VL 和 VAE。可選啟用 Lightning LoRA 以獲得更快的預覽和快速迭代。如果禁用 LoRA,基礎模型將優先考慮最大保真度和一致性。
單圖像 › KSampler 和輸出
取樣器執行您的編輯,條件由編碼器衍生,然後解碼為圖像。使用預覽評估編輯是否滿足指令而不偏離原始外觀。當您滿意時,保存最終圖像。
ComfyUI Qwen Image Edit 2511 工作流程中的關鍵節點
TextEncodeQwenImageEditPlusAdvance_lrzjason (#13, #64)
- 角色:將您的指令與一個或多個參考圖像打包成指導 Qwen Image Edit 2511 的條件。對於多圖像任務,明確在指令中提及第一和第二圖像,以控制轉移的內容。如果看到過度編輯,請使指令更具約束性(例如,「不要改變姿勢或照明」),並保持描述錨定在圖像中的實際對象。
KSampler (#48, #72)
- 角色:驅動將條件轉換為最終編輯的擴散過程。啟用 Lightning LoRA 時,使用非常少的步驟和低指導進行快速操作;不使用時,增加步驟以獲得最大保真度。如果結果偏離,降低指導;如果變化過於微妙,增加一些指導或步驟。
LoraLoaderModelOnly (#49, #68)
- 角色:注入 Qwen‑Image‑Edit‑2511‑Lightning LoRA 以進行 4 步加速。保持權重在其默認值附近以獲得忠實結果,並在需要與基礎模型的質量進行比較或精細編輯時將其關閉。
FluxKontextImageScale (#5, #6, #62)
- 角色:將輸入調整為穩定的工作尺寸,使編碼器和取樣器看到一致的空間上下文。在大多數情況下保持開啟;如果必須精確保存原始分辨率,請先在此處調整,然後用取樣器進一步細化。
可選附加功能
- 編寫指令,命名主題和範圍:「將夾克顏色改為海軍藍,保持面料紋理和照明」比模糊的風格提示提供更可靠的圖像編輯。
- 對於多圖像轉移,選擇視角和照明與基礎圖像相似的捐贈者;這改善了材料和風格匹配。
- 啟用 Lightning 進行快速預覽時,確認最終標準運行,如果需要絕對最高的保真度。
- 如果編輯觸及框架過多,添加約束如「保持背景不變」或「保留面部特徵」以收緊單圖像編輯行為。
參考資料
- Qwen‑Image‑Edit‑2511 模型卡:Hugging Face
- Qwen2.5‑VL‑7B‑Instruct:Hugging Face
- Qwen Image VAE 和 ComfyUI 的打包文件:Hugging Face
- Qwen‑Image‑Edit‑2511‑Lightning LoRA:Hugging Face
- Qwen‑Image 技術報告:arXiv
致謝
此工作流程實施並構建於以下作品和資源之上。我們感謝 Qwen 提供的 Qwen-Image-Edit-2511 模型的貢獻和維護。有關權威詳細信息,請參閱下方鏈接的原始文檔和存儲庫。
資源
- Qwen/Qwen-Image-Edit-2511
- GitHub: QwenLM/Qwen-Image
- Hugging Face: Qwen/Qwen-Image-Edit-2511
- arXiv: 2508.02324
注意:使用參考的模型、數據集和代碼需遵循其作者和維護者提供的相關許可和條款。


