LongCat 圖像編輯 Turbo: 在 ComfyUI 中快速提示引導的圖像編輯#
LongCat 圖像編輯 Turbo 是一個專為快速、提示引導的編輯而設計的 ComfyUI 工作流程,保持您的主題和構圖不變。它結合了 LongCat 圖像編輯 Turbo 模型、Qwen2.5-VL 調節和 AE VAE,在快速、友好的迭代循環中提供角色重新設計、類似遮罩的局部變化和電影照明調整。
專為創作者和高級用戶設計,這個 LongCat 圖像編輯 Turbo 圖表接受任何源圖像,通過視覺-語言編碼器解釋您的編輯意圖,並返回保留原始構圖的高保真結果。它已準備好 RunComfy,並針對快速預覽和受控精細化進行了優化。
Comfyui LongCat 圖像編輯 Turbo 工作流程中的關鍵模型#
- LongCat 圖像編輯 Turbo (bf16)。該擴散模型支持快速、保持構圖的圖像編輯,同時對文本指導有強烈反應。 Model file
- Qwen2.5-VL 7B 文本編碼器 (FP8 scaled, ComfyUI packaged)。通過理解您的提示和輸入圖像的視覺上下文來生成豐富的調節。 Encoder file
- AE VAE (ae.safetensors)。從潛在空間重建圖像,損失較低,幫助 LongCat 圖像編輯 Turbo 在取樣後保留細節。 VAE file
如何使用 Comfyui LongCat 圖像編輯 Turbo 工作流程#
工作流程從您的圖像和提示到解碼結果遵循清晰的路徑。階段圍繞一些決定性組件組織,保持編輯快速穩定。
加載並準備您的源圖像#
- 使用
LoadImage(#79) 導入您的圖片。圖表通過FluxKontextImageScale(#64) 將其路由以標準化比例,便於穩健編輯。 - 然後,圖像通過
GetImageSize(#72) 和EmptyLatentImage(#61) 設定工作畫布,這有助於 LongCat 圖像編輯 Turbo 維持構圖和主題位置。 - 這種準備確保隨後的編輯像智能、類似遮罩的調整,而不是全面重新合成。
使用 Qwen 編碼您的編輯意圖#
- 工作流程使用
CLIPLoader(#19) 加載 Qwen2.5-VL 編碼器。 - 在
TextEncodeQwenImageEditPlus (Positive)(#53) 中描述您想要的變化。使用清晰的風格、照明或屬性提示讓 LongCat 圖像編輯 Turbo 應用。 - 使用
TextEncodeQwenImageEditPlus (Negative)(#54) 列出要避免或保護的元素,這有助於保持身份和避免不必要的更改。 - 編碼器讀取您的文本和源圖像,創建編輯感知的調節,將變化錨定在原始場景上。
形狀指導和參考混合#
FluxGuidance(#21) 和FluxGuidance(#22) 調整正面和負面指令對結果的影響力度。更高的強調推動更大膽的編輯;較低的強調則偏向微妙、安全的構圖調整。FluxKontextMultiReferenceLatentMethod(#51) 和FluxKontextMultiReferenceLatentMethod(#52) 控制多個參考的混合方式。如果您選擇添加它們,默認情況下,標記為“DO NOT USE (LEAVE BYPASSED)”的輔助子圖保持不活動;如果需要額外的風格或屬性參考,請用您自己的圖像加載器替換它。
運行取樣器#
- LongCat 圖像編輯 Turbo UNet 由
UNETLoader(#18) 加載,並使用CFGNorm(#23) 正規化以穩定指導。 KSampler(#27) 執行實際擴散步驟,將您的意圖和上下文轉換為新的潛在空間。從快速迭代開始進行預覽,然後根據需要調整提示或指導強度以獲得最終質量。- 將編輯重點放在每次通過單一、明確的目標上,以獲得最可預測的結果。
解碼和導出#
- AE VAE 通過
VAELoader(#20) 引入,並由VAEDecode(#25) 用於從取樣的潛在空間中高保真地重建圖像。 SaveImage(#9) 將結果寫入您的輸出目錄,帶有清晰的前綴,便於跟蹤不同運行中的變化。
Comfyui LongCat 圖像編輯 Turbo 工作流程中的關鍵節點#
TextEncodeQwenImageEditPlus (Positive)(#53)。使用 Qwen2.5-VL 和源圖像將您想要的變化轉換為編輯感知的調節。集中您的提示在主題和您想要的變化上,如服裝、情感、照明或材料,以指導 LongCat 圖像編輯 Turbo 不偏離場景。TextEncodeQwenImageEditPlus (Negative)(#54)。通過指定要避免的內容來保護身份和構圖。使用它來減少偽影或防止不必要的重新設計,同時保持場景一致。FluxGuidance(#21)。調整正面指令推動編輯的力度。增加以加強重新設計或戲劇性照明;減少以保持更多原始外觀。平衡這一點與您提示的詳細程度及提供的參考數量。FluxKontextMultiReferenceLatentMethod(#51)。確定多個參考如何混合到調節中。選擇與您的目標匹配的方法,例如更強的融合用於風格轉移,而輕微的影響則用於屬性微調。CFGNorm(#23)。正規化指導行為,以便在不同設置中保持變化一致性。它幫助 LongCat 圖像編輯 Turbo 在迭代提示或切換取樣器時保持穩定。KSampler(#27)。生成的核心。用於快速迭代,鎖定種子以實現可重複性,並在您喜歡方向後試驗不同的取樣器。與FluxGuidance並行調整以權衡編輯強度與對原始的忠實度。FluxKontextImageScale(#64)。準備並縮放輸入圖像以供下游節點使用。這一步是保持編輯過程中框架和比例穩定的關鍵。
可選擴展#
- 添加更多參考。如果您需要多圖像指導,請用您自己的
LoadImage節點替換旁路輔助子圖,並將它們插入 Qwen 編碼節點的額外參考輸入中。這對於風格或服裝轉移很有用,同時保持姿勢和佈局。 - 快速迭代提示。從簡潔的提示開始,進行快速預覽,然後細化措辭或指導強度。使用種子重現您喜歡的外觀並分支小變化。
- 通過措辭進行局部更改。明確指定目標,例如“僅將夾克變為紅色”或“在主題上添加柔和的邊緣光”,以驅動類似遮罩的編輯而不需要明確的遮罩。
- GGUF 變體。對於 CPU 或非常低的 VRAM 場景,您可以用
UnetLoaderGGUF(#77) 替換為量化的 LongCat 圖像編輯 Turbo 權重。查看 GGUF 包以獲取可用的量化信息。 Model variants
致謝#
此工作流程實施並建立在以下作品和資源上。我們感謝 Comfy-Org 提供的 LongCat 圖像編輯 Turbo 及相關組件,vantagewithai 提供的 LongCat 圖像編輯 Turbo GGUF 模型,以及 Civitai 社區對 LongCat 圖像編輯 Turbo 工作流程的貢獻和維護。欲了解權威詳情,請參閱以下鏈接的原始文檔和存儲庫。
資源#
- Civitai/Civitai 工作流程來源
- 文檔 / 發布說明: Civitai 模型頁面
- Comfy-Org/LongCat Image Edit Turbo bf16 模型
- Hugging Face: Comfy-Org/LongCat-Image
- vantagewithai/LongCat Image Edit Turbo GGUF 模型
- Hugging Face: vantagewithai/LongCat-Image-Edit-Turbo-GGUF
- Comfy-Org/Qwen 2.5 VL 文本編碼器
- Hugging Face: Comfy-Org/Qwen-Image_ComfyUI
- Comfy-Org/AE VAE
- Hugging Face: Comfy-Org/z_image_turbo
注意:使用參考的模型、數據集和代碼需遵循其作者和維護者提供的相應許可和條款。









