此工作流程將 Z-Image-Turbo 和一組旋轉的 Z-Image 精調模型組裝成一個單一、可投入生產的 ComfyUI 圖。它旨在並排比較風格,保持提示行為一致,並以最少的步驟產生清晰、一致的結果。在其內部,它結合了優化的 UNet 加載、CFG 正規化、AuraFlow 兼容的採樣,以及可選的 LoRA 注入,以便您可以在不重新布線畫布的情況下探索現實主義、電影肖像、黑暗奇幻和動漫啟發的外觀。
Z-Image 精調模型非常適合那些想要快速評估多個檢查點和 LoRAs 的藝術家、提示工程師和模型探索者,同時保持在一個一致的管道內。輸入一個提示,從不同的 Z-Image 精調中渲染四個變體,並迅速鎖定最符合您簡報的風格。
Tongyi-MAI Z-Image-Turbo:一個6B參數的單流擴散變壓器,為少步驟、寫實文本到圖像而提煉,具有強大的指令遵循和雙語文本渲染功能。官方權重和使用說明見模型卡,技術報告和提煉方法詳見 arXiv 和項目庫。Model • Paper • Decoupled-DMD • DMDR • GitHub • Diffusers pipeline
BEYOND REALITY Z-Image(社區精調):一個傾向於寫實的 Z-Image 檢查點,強調光澤質感、清晰邊緣和風格化的完成,適合肖像和類產品的構圖。Model
Z-Image-Turbo-Realism LoRA(在此工作流程的 LoRA 通道中使用的示例 LoRA):一個輕量級的適配器,在保持基礎 Z-Image-Turbo 提示對齊的同時推動超寫實渲染;可在不替換基礎模型的情況下加載。Model
AuraFlow 系列(採樣兼容參考):工作流程使用 AuraFlow 風格的採樣掛鉤,以穩定的少步驟生成;有關 AuraFlow 調度器和其設計目標的背景,請參閱管道參考。Docs
圖表組織為四個獨立的生成通道,這些通道共享一個共同的文本編碼器和VAE。使用一個提示來驅動所有通道,然後比較從每個分支保存的結果。
一般模型
CLIPTextEncode (#75) 中輸入您的描述,並在負面的 CLIPTextEncode (#74) 中添加可選約束。這樣可以保持各分支的條件相同,以便公平評估每個精調的表現。VAELoader (#21) 提供所有通道用來將潛在變量轉換回圖像的解碼器。Z-Image(Base Turbo)
UNETLoader (#100) 運行官方的 Z-Image-Turbo UNet,並使用 ModelSamplingAuraFlow (#76) 進行少步驟穩定性修補。CFGNorm (#67) 標準化無分類器引導行為,從而使採樣器的對比度和細節在提示之間保持可預測。EmptyLatentImage (#19) 定義畫布大小,然後 KSampler (#78) 生成潛在變量,這些變量由 VAEDecode (#79) 解碼並由 SaveImage (#102) 寫入。使用此分支作為評估其他 Z-Image 精調模型時的基準。Z-Image-Turbo + Realism LoRA
UNETLoader (#82) 上注入一個樣式適配器,通過 LoraLoaderModelOnly (#106)。ModelSamplingAuraFlow (#84) 和 CFGNorm (#64) 使輸出保持清晰,而 LoRA 則推動現實主義而不壓倒主題內容。用 EmptyLatentImage (#71) 定義分辨率,用 KSampler (#85) 生成,通過 VAEDecode (#86) 解碼,並使用 SaveImage (#103) 保存。如果 LoRA 感覺太強,請在此處減少其權重,而不是過度編輯您的提示。BEYOND REALITY 精調
UNETLoader (#88) 替換成一個社區檢查點,以提供風格化、高對比度的外觀。CFGNorm (#66) 控制引導,使視覺特徵在更換採樣器或步驟時保持清晰。設置您的目標大小在 EmptyLatentImage (#72),使用 KSampler (#89) 渲染,VAEDecode (#90) 解碼,並通過 SaveImage (#104) 保存。使用與基礎通道相同的提示,來查看此精調如何解釋構圖和照明。Red Tide Dark Beast AIO 精調
CheckpointLoaderSimple (#92) 加載,然後由 CFGNorm (#65) 正規化。此通道傾向於情緒化的色彩調色板和更重的微對比,同時保持良好的提示合規性。在 EmptyLatentImage (#73) 中選擇您的框架,使用 KSampler (#93) 生成,通過 VAEDecode (#94) 解碼,並從 SaveImage (#105) 導出。這是在相同的 Z-Image 精調模型設置中測試更粗獷美學的實際方法。ModelSamplingAuraFlow (#76, #84)
shift 控制微調採樣軌跡;將其視為一個微調旋鈕,與您的採樣器選擇和步數預算交互。為了在各通道中得到最佳的可比性,保持相同的採樣器,並在每次測試中僅調整一個變量(例如,shift 或 LoRA 權重)。參考:AuraFlow 管道背景和調度說明。DocsCFGNorm (#64, #65, #66, #67)
strength;如果圖像開始顯得過於壓縮,則減少它。當您想要 Z-Image 精調模型的乾淨 A/B 比較時,保持其在各分支間相似。LoraLoaderModelOnly (#106)
strength 參數控制風格影響;較低值保留基礎現實主義,而較高值則強加 LoRA 的外觀。如果 LoRA 壓倒了面部或字體,首先降低其權重,然後微調提示措辭。KSampler (#78, #85, #89, #93)
shift 來隔離原因和效果。SaveImage 節點被獨特標記,以便您能快速比較和整理。進一步閱讀的鏈接:
此工作流程實現並建立在以下作品和資源的基礎上。我們誠摯感謝 HuggingFace 模型對本文的貢獻和維護。欲了解權威詳情,請參閱下列鏈接中的原始文檔和庫。
注意:引用的模型、數據集和代碼的使用需遵循其作者和維護者提供的相應許可和條款。
RunComfy 是首選的 ComfyUI 平台,提供 ComfyUI 在線 環境和服務,以及 ComfyUI 工作流程 具有驚豔的視覺效果。 RunComfy還提供 AI Models, 幫助藝術家利用最新的AI工具創作出令人驚艷的藝術作品。