Z Image Turbo for ComfyUI:快速文本轉圖像,近乎實時迭代
此工作流程將 Z Image Turbo 引入 ComfyUI,使您能夠以極少的步驟和嚴格的提示遵循來生成高分辨率、寫實的視覺效果。專為需要快速、一致渲染的創作者設計,適用於概念藝術、廣告合成、互動媒體和快速 A/B 測試。
此流程從文本提示到圖像遵循一條清晰路徑:加載 Z Image 模型和支持組件,編碼正面和負面提示,創建潛在畫布,使用 AuraFlow 調度進行採樣,然後解碼為 RGB 以保存。結果是一個精簡的 Z Image 管道,重視速度而不犧牲細節。
ComfyUI Z Image 工作流程中的關鍵模型
- Tongyi-MAI Z Image Turbo。主要生成器,在精餾、步驟高效的方式中執行去噪。它針對寫實主義、清晰的紋理和忠實的構圖,同時保持低延遲。Model card
- Qwen 4B 文本編碼器 (qwen_3_4b.safetensors)。為模型提供語言條件,以便您的提示中的風格、主題和構圖引導去噪軌跡。
- 自動編碼器 AE (ae.safetensors)。在潛在空間和像素之間進行轉換,以便可以查看和導出最終的 Z Image 結果。
如何使用 ComfyUI Z Image 工作流程
在高層次上,路徑從提示到條件,通過 Z Image 採樣,然後解碼為圖像。節點被聚集到階段中,以保持操作簡單。
模型加載器:UNETLoader (#16), CLIPLoader (#18), VAELoader (#17)
此階段加載核心 Z Image Turbo 檢查點、文本編碼器和自動編碼器。如果您擁有 BF16 檢查點,請選擇它,因為它在消費者 GPU 上平衡速度和質量。CLIP 風格編碼器確保您的措辭控制場景和風格。AE 用於在採樣完成後將潛在轉換回 RGB。
提示:CLIP Text Encode (Positive Prompt) (#6) 和 CLIP Text Encode (Negative Prompt) (#7)
在正面提示中使用具體名詞、風格提示、相機提示和照明寫下您想要的內容。使用負面提示抑制常見的模糊或不需要的物體等工件。如果您看到提示前綴,如官方示例中的指示標題,您可以保留、編輯或刪除它,工作流程仍將運行。這些編碼器共同產生在採樣過程中引導 Z Image 的條件。
潛在和調度器:EmptySD3LatentImage (#13) 和 ModelSamplingAuraFlow (#11)
通過設置潛在畫布選擇您的輸出尺寸。調度器節點將模型切換到與步驟高效精餾模型非常匹配的 AuraFlow 風格採樣策略。這保持了在低步驟計數下的軌跡穩定,同時保留了精細細節。一旦畫布和時間表設置好,管道就準備開始去噪。
採樣:KSampler (#3)
此節點使用加載的 Z Image 模型、所選的調度器和您的提示條件執行實際去噪。調整採樣器類型和步驟數以在需要時在速度和細節之間進行權衡。指導比例控制相對於先前的提示強度;適中的值通常能提供最佳的保真度和平衡創意變化。隨機化種子以進行探索或固定以獲得可重複的結果。
解碼和保存:VAEDecode (#8) 和 SaveImage (#9)
採樣後,AE 將潛在解碼為圖像。保存節點將文件寫入您的輸出目錄,以便您可以比較迭代或將結果輸入下游任務中。如果您計劃升級或後期處理,請保持解碼在您期望的工作分辨率並導出無損格式以獲得最佳質量保留。
ComfyUI Z Image 工作流程中的關鍵節點
UNETLoader (#16)
加載 Z Image Turbo 檢查點 (z_image_turbo_bf16.safetensors)。使用此來在精度變體或更新的權重之間切換。要讓種子和提示保持可比性,請在整個會話中保持模型一致。更改基礎模型將改變外觀、色彩反應和細節密度。
ModelSamplingAuraFlow (#11)
將採樣策略設置為適合快速收斂的 AuraFlow 風格計劃。這是使 Z Image 在低步驟計數下高效,同時保留細節和一致性的關鍵。如果您稍後更換計劃,請重新檢查步驟計數和指導以保持類似的輸出特徵。
KSampler (#3)
控制採樣器算法、步驟、指導和種子。使用較少的步驟進行快速構思,僅在需要更多微觀細節或更嚴格的提示遵循時增加。不同的採樣器偏愛不同的外觀;嘗試幾種,並在比較結果時保持其餘管道固定。
CLIP Text Encode (Positive Prompt) (#6)
編碼驅動 Z Image 的創意意圖。專注於主題、媒介、鏡頭、照明、構圖以及任何品牌或設計約束。與負面提示節點配對,以將圖像推向您的目標外觀,同時過濾已知的工件。
可選附加內容
- 在第一遍使用方形或接近方形的分辨率,然後在構圖鎖定後調整縱橫比。
- 保留可重用的提示片段庫,用於主題、鏡頭和照明,以加速跨項目的迭代。
- 為了一致的藝術指導,固定種子並在每次迭代中僅改變單個因素,例如風格標籤或相機提示。
- 如果輸出感覺過度控制,輕微降低指導或從正面提示中刪除過於規定的短語。
- 當準備下游編輯資產時,導出無損 PNG 並保留提示、種子和分辨率的記錄,與每個 Z Image 渲染一起。
致謝
此工作流程實施並建立在以下作品和資源之上。我們感謝 Tongyi-MAI 提供 Z-Image-Turbo 的貢獻和維護。有關權威詳情,請參見下方鏈接的原始文檔和存儲庫。
資源
- Tongyi-MAI/Z-Image-Turbo
- Hugging Face: Tongyi-MAI/Z-Image-Turbo
注意:使用引用的模型、數據集和代碼受其作者和維護者提供的相應許可和條款約束。
