Z-Image 精調模型:在 ComfyUI 中的多風格、高質量圖像生成
此工作流程將 Z-Image-Turbo 和一組旋轉的 Z-Image 精調模型組裝成一個單一、可投入生產的 ComfyUI 圖。它旨在並排比較風格,保持提示行為一致,並以最少的步驟產生清晰、一致的結果。在其內部,它結合了優化的 UNet 加載、CFG 正規化、AuraFlow 兼容的採樣,以及可選的 LoRA 注入,以便您可以在不重新布線畫布的情況下探索現實主義、電影肖像、黑暗奇幻和動漫啟發的外觀。
Z-Image 精調模型非常適合那些想要快速評估多個檢查點和 LoRAs 的藝術家、提示工程師和模型探索者,同時保持在一個一致的管道內。輸入一個提示,從不同的 Z-Image 精調中渲染四個變體,並迅速鎖定最符合您簡報的風格。
Comfyui Z-Image 精調模型工作流程中的關鍵模型
- Tongyi-MAI Z-Image-Turbo:一個6B參數的單流擴散變壓器,為少步驟、寫實文本到圖像而提煉,具有強大的指令遵循和雙語文本渲染功能。官方權重和使用說明見模型卡,技術報告和提煉方法詳見 arXiv 和項目庫。Model • Paper • Decoupled-DMD • DMDR • GitHub • Diffusers pipeline
- BEYOND REALITY Z-Image(社區精調):一個傾向於寫實的 Z-Image 檢查點,強調光澤質感、清晰邊緣和風格化的完成,適合肖像和類產品的構圖。Model
- Z-Image-Turbo-Realism LoRA(在此工作流程的 LoRA 通道中使用的示例 LoRA):一個輕量級的適配器,在保持基礎 Z-Image-Turbo 提示對齊的同時推動超寫實渲染;可在不替換基礎模型的情況下加載。Model
- AuraFlow 系列(採樣兼容參考):工作流程使用 AuraFlow 風格的採樣掛鉤,以穩定的少步驟生成;有關 AuraFlow 調度器和其設計目標的背景,請參閱管道參考。Docs
如何使用 Comfyui Z-Image 精調模型工作流程
圖表組織為四個獨立的生成通道,這些通道共享一個共同的文本編碼器和VAE。使用一個提示來驅動所有通道,然後比較從每個分支保存的結果。
- 一般模型
- 共享設置加載文本編碼器和VAE。在正面的
CLIPTextEncode(#75) 中輸入您的描述,並在負面的CLIPTextEncode(#74) 中添加可選約束。這樣可以保持各分支的條件相同,以便公平評估每個精調的表現。VAELoader(#21) 提供所有通道用來將潛在變量轉換回圖像的解碼器。
- 共享設置加載文本編碼器和VAE。在正面的
- Z-Image(Base Turbo)
- 此通道通過
UNETLoader(#100) 運行官方的 Z-Image-Turbo UNet,並使用ModelSamplingAuraFlow(#76) 進行少步驟穩定性修補。CFGNorm(#67) 標準化無分類器引導行為,從而使採樣器的對比度和細節在提示之間保持可預測。EmptyLatentImage(#19) 定義畫布大小,然後KSampler(#78) 生成潛在變量,這些變量由VAEDecode(#79) 解碼並由SaveImage(#102) 寫入。使用此分支作為評估其他 Z-Image 精調模型時的基準。
- 此通道通過
- Z-Image-Turbo + Realism LoRA
- 此通道在基礎
UNETLoader(#82) 上注入一個樣式適配器,通過LoraLoaderModelOnly(#106)。ModelSamplingAuraFlow(#84) 和CFGNorm(#64) 使輸出保持清晰,而 LoRA 則推動現實主義而不壓倒主題內容。用EmptyLatentImage(#71) 定義分辨率,用KSampler(#85) 生成,通過VAEDecode(#86) 解碼,並使用SaveImage(#103) 保存。如果 LoRA 感覺太強,請在此處減少其權重,而不是過度編輯您的提示。
- 此通道在基礎
- BEYOND REALITY 精調
- 此路徑使用
UNETLoader(#88) 替換成一個社區檢查點,以提供風格化、高對比度的外觀。CFGNorm(#66) 控制引導,使視覺特徵在更換採樣器或步驟時保持清晰。設置您的目標大小在EmptyLatentImage(#72),使用KSampler(#89) 渲染,VAEDecode(#90) 解碼,並通過SaveImage(#104) 保存。使用與基礎通道相同的提示,來查看此精調如何解釋構圖和照明。
- 此路徑使用
- Red Tide Dark Beast AIO 精調
- 一個以黑暗奇幻為導向的檢查點使用
CheckpointLoaderSimple(#92) 加載,然後由CFGNorm(#65) 正規化。此通道傾向於情緒化的色彩調色板和更重的微對比,同時保持良好的提示合規性。在EmptyLatentImage(#73) 中選擇您的框架,使用KSampler(#93) 生成,通過VAEDecode(#94) 解碼,並從SaveImage(#105) 導出。這是在相同的 Z-Image 精調模型設置中測試更粗獷美學的實際方法。
- 一個以黑暗奇幻為導向的檢查點使用
Comfyui Z-Image 精調模型工作流程中的關鍵節點
ModelSamplingAuraFlow(#76, #84)- 目的:將模型修補為使用 AuraFlow 兼容的採樣路徑,該路徑在非常低的步數下仍然穩定。
shift控制微調採樣軌跡;將其視為一個微調旋鈕,與您的採樣器選擇和步數預算交互。為了在各通道中得到最佳的可比性,保持相同的採樣器,並在每次測試中僅調整一個變量(例如,shift或 LoRA 權重)。參考:AuraFlow 管道背景和調度說明。Docs
- 目的:將模型修補為使用 AuraFlow 兼容的採樣路徑,該路徑在非常低的步數下仍然穩定。
CFGNorm(#64, #65, #66, #67)- 目的:標準化無分類器引導,以免在更換模型、步驟或調度器時對比度和細節劇烈變化。如果高光消退或紋理在通道之間感覺不一致,增加其
strength;如果圖像開始顯得過於壓縮,則減少它。當您想要 Z-Image 精調模型的乾淨 A/B 比較時,保持其在各分支間相似。
- 目的:標準化無分類器引導,以免在更換模型、步驟或調度器時對比度和細節劇烈變化。如果高光消退或紋理在通道之間感覺不一致,增加其
LoraLoaderModelOnly(#106)- 目的:直接將 LoRA 適配器注入加載的 UNet,而不改變基礎檢查點。
strength參數控制風格影響;較低值保留基礎現實主義,而較高值則強加 LoRA 的外觀。如果 LoRA 壓倒了面部或字體,首先降低其權重,然後微調提示措辭。
- 目的:直接將 LoRA 適配器注入加載的 UNet,而不改變基礎檢查點。
KSampler(#78, #85, #89, #93)- 目的:運行實際的擴散循環。選擇一個與少步驟提煉配對良好的採樣器和調度器;許多用戶偏好 Euler 風格的採樣器與均勻或多步調度器搭配 Turbo 級模型。在比較通道時保持種子不變,並一次只改變一個變量,以了解每個精調的行為。
可選附加項
- 以一段描述性段落風格的提示開始,並在所有通道中重用,以評估 Z-Image 精調模型之間的差異;僅在選擇喜愛的分支後迭代風格詞。
- 對於 Turbo 級模型,極低或甚至為零的 CFG 通常會產生最乾淨的結果;僅在必須排除特定元素時使用負提示。
- 在進行 A/B 測試時保持相同的分辨率、採樣器和種子;以小幅調整 LoRA 權重或
shift來隔離原因和效果。 - 每個分支都會寫入自己的輸出;四個
SaveImage節點被獨特標記,以便您能快速比較和整理。
進一步閱讀的鏈接:
- Z-Image-Turbo 模型卡:Tongyi-MAI/Z-Image-Turbo
- 技術報告和方法:Z-Image • Decoupled-DMD • DMDR
- 項目庫:Tongyi-MAI/Z-Image
- 示例精調:Nurburgring/BEYOND_REALITY_Z_IMAGE
- 示例 LoRA:Z-Image-Turbo-Realism-LoRA
致謝
此工作流程實現並建立在以下作品和資源的基礎上。我們誠摯感謝 HuggingFace 模型對本文的貢獻和維護。欲了解權威詳情,請參閱下列鏈接中的原始文檔和庫。
資源
- HuggingFace 模型:
注意:引用的模型、數據集和代碼的使用需遵循其作者和維護者提供的相應許可和條款。



