此工作流程將 FLUX.2 Dev 的強大功能帶入 ComfyUI,用於高保真的文本到圖像生成和多參考圖像編輯。它專為需要寫實細節、一致身份和強提示依從性的創作者而設計,適用於產品照片、角色渲染、廣告視覺和概念藝術。您可以運行標準分支或輕量的 FP8 分支,保持布局和材料一致,並擴展到多百萬像素輸出。
Flux 2 Dev 將精確的提示與參考驅動控制相結合,因此您可以在變化中保持風格和設計連續性。圖形包括即用型參考槽、靈活的圖像尺寸和自定義的取樣路徑,平衡質量和速度。它非常適合於迭代創意、場景級一致性和在消費級 GPU 上的生產級結果。
圖形包含兩個平行分支。“Image_flux2”是標準路徑;“Image_flux2_fp8”是一個較輕的變體,替換為 FP8 文本編碼器以節省內存。從提示到保存一次僅使用一個分支。兩個分支共享相同的總體邏輯:加載模型、撰寫提示、可選地添加一個或多個參考圖像、選擇圖像尺寸、取樣和保存。
工作流程自動加載 Flux 2 Dev 擴散模型、Flux 2 Dev 兼容的文本編碼器和 Flux 2 VAE。在標準分支中,這些由 UNETLoader (#12)、CLIPLoader (#38) 和 VAELoader (#10) 處理。在 FP8 分支中,它們由 UNETLoader (#86)、CLIPLoader (#90) 和 VAELoader (#70) 鏡像處理。通常不需要觸碰這些,除非您想更換權重。
在 CLIP Text Encode (Positive Prompt) (#6) 或 (#85) 中撰寫您的描述。好的提示應命名主題、構圖、材料、照明和期望的風格(例如,工作室主光、柔和陰影、光滑塑料、寬光圈)。Flux 2 Dev 對清晰的名詞和簡潔的風格標籤反應良好,並且可以在明確說明時保存布局指令和排版。當您希望參考圖像佔主導地位時,保持提示簡單;當您希望更強的創意指導時,則需要更加描述性。
內置參考支持,因此您可以指導身份、風格或設計連續性。將圖像拖入 LoadImage 節點,這些圖像將被預處理為合適尺寸、編碼為潛在變量,並通過鏈接的 ReferenceLatent 節點融合到條件中。按照顯示的模式在 FP8 分支中添加更多參考(布局可擴展到多個參考)。要完全禁用參考,繞過所有 ReferenceLatent 節點,您將獲得純文本到圖像行為。
取樣由 SamplerCustomAdvanced 組織,具有可選的取樣器(KSamplerSelect)和 Flux 2 調度器。RandomNoise 節點提供可重複的種子以確保可再現性。調度器驅動去噪路徑,而指導器則使用您的提示和參考潛在變量對模型進行調節。此路徑經過調整,以在保持互動性的同時提供清晰細節和一致結構,便於快速迭代。
寬度和高度控制同時提供給調度器和潛在畫布,因此模型在預期分辨率下去噪。Flux 2 Dev 舒適地瞄準 1–4 百萬像素;當您喜歡框架時,從較小的尺寸開始進行外觀開發,然後放大。保持長寬比與您的主題和參考圖像一致,以保持構圖和身份提示。
取樣後,潛在變量由 VAE 解碼並由 SaveImage 寫出。使用相同的種子再次運行,以確保拍攝的一致性,或更改種子以在保持相同提示和參考的同時探索新變化。
CLIP Text Encode (Positive Prompt) (#6, #85)使用 Flux 2 Dev 兼容的文本編碼器將您的文本編碼為嵌入。強有力的名詞和清晰的材料和照明術語產生最可靠的指導。如果大量使用參考,保持提示簡潔,使其補充而不是與參考相抗衡。
FluxGuidance (#26, #75)應用特定於 Flux 的條件強度,平衡提示影響與模型先驗和參考。增加指導以加強提示依從性;當參考圖像應佔主導地位時,減少它。小步調整並重複運行幾個種子以確認輸出的一致性。
ReferenceLatent (#39, #43, #83, #84)將編碼的參考潛在變量注入條件流,以保持身份、風格或布局提示。通過按照現有模式鏈接節點使用多個參考。繞過單個節點進行 A/B 測試每個參考的貢獻,或在純文本和多參考模式之間切換。
Flux2Scheduler (#48, #67)創建為 Flux 2 Dev 和您選擇的分辨率量身定制的 sigma 調度。更多步驟通常會以速度換取細節和穩定性。謹慎地配對調度更改與取樣器更改,以便您可以將改進歸因於一次一個變量。
KSamplerSelect (#16, #81)選擇自定義取樣器使用的取樣算法。Euler 是廣泛主題的堅實默認選擇。僅在追求特定外觀或行為時切換取樣器;在比較時保持其他設置不變。
SamplerCustomAdvanced (#13, #80)使用取樣器、調度、指導器和潛在畫布運行去噪循環。您將在此重訪的關鍵杠桿是 steps、sampler 和來自噪音節點的 seed。在探索場景時,一次只更改其中一個以了解其效果。
EmptyFlux2LatentImage (#47, #79)定義用於在目標寬度和高度下去噪的潛在畫布。較大的畫布增加了細節,但也提高了每幅圖像的 VRAM 使用量和時間。將畫布的長寬比與您的主題匹配,以獲得更自然的構圖。
鏈接到官方權重和資產:
此工作流程實施並構建於以下作品和資源之上。我們對 Comfy Org 在 ComfyUI: Frontier Visual Intelligence 的 FLUX.2 Day-0 支持的貢獻和維護表示由衷的感謝。欲了解權威詳情,請參考下列鏈接的原始文檔和倉庫。
注意:使用所引用的模型、數據集和代碼受其作者和維護者提供的各自許可和條款的約束。
RunComfy 是首選的 ComfyUI 平台,提供 ComfyUI 在線 環境和服務,以及 ComfyUI 工作流程 具有驚豔的視覺效果。 RunComfy還提供 AI Playground, 幫助藝術家利用最新的AI工具創作出令人驚艷的藝術作品。