Z-Image 精調模型在 ComfyUI 中的應用 | 多風格圖像工作流程

Z-Image 精調模型：在 ComfyUI 中的多風格、高質量圖像生成

此工作流程將 Z-Image-Turbo 和一組旋轉的 Z-Image 精調模型組裝成一個單一、可投入生產的 ComfyUI 圖。它旨在並排比較風格，保持提示行為一致，並以最少的步驟產生清晰、一致的結果。在其內部，它結合了優化的 UNet 加載、CFG 正規化、AuraFlow 兼容的採樣，以及可選的 LoRA 注入，以便您可以在不重新布線畫布的情況下探索現實主義、電影肖像、黑暗奇幻和動漫啟發的外觀。

Z-Image 精調模型非常適合那些想要快速評估多個檢查點和 LoRAs 的藝術家、提示工程師和模型探索者，同時保持在一個一致的管道內。輸入一個提示，從不同的 Z-Image 精調中渲染四個變體，並迅速鎖定最符合您簡報的風格。

Comfyui Z-Image 精調模型工作流程中的關鍵模型

Tongyi-MAI Z-Image-Turbo：一個6B參數的單流擴散變壓器，為少步驟、寫實文本到圖像而提煉，具有強大的指令遵循和雙語文本渲染功能。官方權重和使用說明見模型卡，技術報告和提煉方法詳見 arXiv 和項目庫。Model • Paper • Decoupled-DMD • DMDR • GitHub • Diffusers pipeline
BEYOND REALITY Z-Image（社區精調）：一個傾向於寫實的 Z-Image 檢查點，強調光澤質感、清晰邊緣和風格化的完成，適合肖像和類產品的構圖。Model
Z-Image-Turbo-Realism LoRA（在此工作流程的 LoRA 通道中使用的示例 LoRA）：一個輕量級的適配器，在保持基礎 Z-Image-Turbo 提示對齊的同時推動超寫實渲染；可在不替換基礎模型的情況下加載。Model
AuraFlow 系列（採樣兼容參考）：工作流程使用 AuraFlow 風格的採樣掛鉤，以穩定的少步驟生成；有關 AuraFlow 調度器和其設計目標的背景，請參閱管道參考。Docs

如何使用 Comfyui Z-Image 精調模型工作流程

圖表組織為四個獨立的生成通道，這些通道共享一個共同的文本編碼器和VAE。使用一個提示來驅動所有通道，然後比較從每個分支保存的結果。

一般模型
- 共享設置加載文本編碼器和VAE。在正面的 CLIPTextEncode (#75) 中輸入您的描述，並在負面的 CLIPTextEncode (#74) 中添加可選約束。這樣可以保持各分支的條件相同，以便公平評估每個精調的表現。VAELoader (#21) 提供所有通道用來將潛在變量轉換回圖像的解碼器。
Z-Image（Base Turbo）
- 此通道通過 UNETLoader (#100) 運行官方的 Z-Image-Turbo UNet，並使用 ModelSamplingAuraFlow (#76) 進行少步驟穩定性修補。CFGNorm (#67) 標準化無分類器引導行為，從而使採樣器的對比度和細節在提示之間保持可預測。EmptyLatentImage (#19) 定義畫布大小，然後 KSampler (#78) 生成潛在變量，這些變量由 VAEDecode (#79) 解碼並由 SaveImage (#102) 寫入。使用此分支作為評估其他 Z-Image 精調模型時的基準。
Z-Image-Turbo + Realism LoRA
- 此通道在基礎 UNETLoader (#82) 上注入一個樣式適配器，通過 LoraLoaderModelOnly (#106)。ModelSamplingAuraFlow (#84) 和 CFGNorm (#64) 使輸出保持清晰，而 LoRA 則推動現實主義而不壓倒主題內容。用 EmptyLatentImage (#71) 定義分辨率，用 KSampler (#85) 生成，通過 VAEDecode (#86) 解碼，並使用 SaveImage (#103) 保存。如果 LoRA 感覺太強，請在此處減少其權重，而不是過度編輯您的提示。
BEYOND REALITY 精調
- 此路徑使用 UNETLoader (#88) 替換成一個社區檢查點，以提供風格化、高對比度的外觀。CFGNorm (#66) 控制引導，使視覺特徵在更換採樣器或步驟時保持清晰。設置您的目標大小在 EmptyLatentImage (#72)，使用 KSampler (#89) 渲染，VAEDecode (#90) 解碼，並通過 SaveImage (#104) 保存。使用與基礎通道相同的提示，來查看此精調如何解釋構圖和照明。
Red Tide Dark Beast AIO 精調
- 一個以黑暗奇幻為導向的檢查點使用 CheckpointLoaderSimple (#92) 加載，然後由 CFGNorm (#65) 正規化。此通道傾向於情緒化的色彩調色板和更重的微對比，同時保持良好的提示合規性。在 EmptyLatentImage (#73) 中選擇您的框架，使用 KSampler (#93) 生成，通過 VAEDecode (#94) 解碼，並從 SaveImage (#105) 導出。這是在相同的 Z-Image 精調模型設置中測試更粗獷美學的實際方法。

Comfyui Z-Image 精調模型工作流程中的關鍵節點

ModelSamplingAuraFlow (#76, #84)
- 目的：將模型修補為使用 AuraFlow 兼容的採樣路徑，該路徑在非常低的步數下仍然穩定。shift 控制微調採樣軌跡；將其視為一個微調旋鈕，與您的採樣器選擇和步數預算交互。為了在各通道中得到最佳的可比性，保持相同的採樣器，並在每次測試中僅調整一個變量（例如，shift 或 LoRA 權重）。參考：AuraFlow 管道背景和調度說明。Docs
CFGNorm (#64, #65, #66, #67)
- 目的：標準化無分類器引導，以免在更換模型、步驟或調度器時對比度和細節劇烈變化。如果高光消退或紋理在通道之間感覺不一致，增加其 strength；如果圖像開始顯得過於壓縮，則減少它。當您想要 Z-Image 精調模型的乾淨 A/B 比較時，保持其在各分支間相似。
LoraLoaderModelOnly (#106)
- 目的：直接將 LoRA 適配器注入加載的 UNet，而不改變基礎檢查點。strength 參數控制風格影響；較低值保留基礎現實主義，而較高值則強加 LoRA 的外觀。如果 LoRA 壓倒了面部或字體，首先降低其權重，然後微調提示措辭。
KSampler (#78, #85, #89, #93)
- 目的：運行實際的擴散循環。選擇一個與少步驟提煉配對良好的採樣器和調度器；許多用戶偏好 Euler 風格的採樣器與均勻或多步調度器搭配 Turbo 級模型。在比較通道時保持種子不變，並一次只改變一個變量，以了解每個精調的行為。