此工作流程利用 Hunyuan Image 2.1 將您的提示轉換為清晰的原生2048×2048 渲染。它將騰訊的擴散變壓器與雙文本編碼器配對,以提高語義對齊和文本渲染質量,然後通過匹配的高壓縮 VAE 進行高效取樣和解碼。如果您需要生產就緒的場景、角色和圖像中清晰的文本,並同時保留速度和控制,這個 ComfyUI Hunyuan Image 2.1 工作流程專為您而設。
創作者、藝術總監和技術藝術家可以插入多語言提示,微調幾個旋鈕,並始終如一地獲得銳利的結果。該圖形配有合理的負面提示、原生2K畫布和FP8 UNet,以保持 VRAM 在控制範圍內,展示了 Hunyuan Image 2.1 的即時效果。
該圖形從提示到像素遵循明確的路徑:用兩個編碼器編碼文本,準備原生2K潛在畫布,使用 Hunyuan Image 2.1 進行取樣,通過匹配的 VAE 解碼並保存輸出。
DualCLIPLoader
(#33) 加載配置為 Hunyuan Image 2.1 的 Qwen2.5‑VL‑7B 和 ByT5 Small。這種雙編碼器設置讓模型能夠解析場景語義,同時對字形和多語言文本保持穩健。CLIPTextEncode
(#6) 中輸入您的主要描述。您可以用英語或中文撰寫,混合攝影提示和照明,並包括圖像中的文本說明。CLIPTextEncode
(#7) 中的即用型負面提示可以抑制常見工件。您可以根據自己的風格進行調整或保持原樣以獲得平衡的結果。EmptyHunyuanImageLatent
(#29) 以單批次初始化2048×2048畫布。Hunyuan Image 2.1 專為2K生成而設計,因此建議使用原生2K尺寸以獲得最佳質量。UNETLoader
(#37) 加載 FP8 检查點以減少 VRAM 同時保持保真度,然後將其提供給 KSampler
(#3) 進行去噪。VAELoader
(#34) 引入 Hunyuan Image 2.1 VAE,VAEDecode
(#8) 使用模型的32×壓縮方案從取樣潛在圖像中重建最終圖像。SaveImage
(#9) 將輸出寫入您選擇的目錄。如果您計劃跨種子或提示進行迭代,請設置清晰的文件名前綴。DualCLIPLoader
(#33)此節點加載 Hunyuan Image 2.1 所需的文本編碼器對。保持模型類型設置為 Hunyuan,並選擇 Qwen2.5‑VL‑7B 和 ByT5 Small 以結合強大的場景理解和字形感知文本處理。如果您在風格上進行迭代,請配合指導調整正面提示,而不是更換編碼器。
CLIPTextEncode
(#6 和 #7)這些節點將您的正面和負面提示轉換為條件。保持正面提示在最上方簡潔,然後添加鏡頭、照明和風格提示。使用負面提示抑制如額外肢體或噪聲文本等工件;如果您覺得它對您的概念過於限制,可以進行修剪。
EmptyHunyuanImageLatent
(#29)定義工作分辨率和批次。默認的2048×2048與 Hunyuan Image 2.1 的原生2K能力對齊。對於其他長寬比,選擇模型友好的寬高對,並考慮在遠離正方形時略微增加步驟。
KSampler
(#3)驅動 Hunyuan Image 2.1 的去噪過程。當您需要更精細的微細節時增加步驟,快速草稿則減少。提高指導以獲得更強的提示符合性,但要注意過度飽和或僵化;降低以獲得更自然的變化。更換種子以探索不同的構圖,而不改變您的提示。
UNETLoader
(#37)加載 Hunyuan Image 2.1 UNet。包含的 FP8 檢查點保持記憶體使用量適中,以便輸出2K。如果您有足夠的 VRAM 並希望為激進設置提供最大空間,請考慮從官方發布中選擇高精度版本的相同模型。
VAELoader
(#34) 和 VAEDecode
(#8)這些節點必須與 Hunyuan Image 2.1 發布版本匹配才能正確解碼。模型的高壓縮 VAE 是快速2K生成的關鍵;配對正確的 VAE 可以避免顏色偏移和塊狀紋理。如果您更改基礎模型,請務必相應更新 VAE。
此工作流程實現並基於以下作品和資源構建。我們感謝 @Ai Verse 和 Hunyuan 提供的 Hunyuan Image 2.1 演示的貢獻和維護。有關權威細節,請參閱下方鏈接的原始文檔和版本庫。
注意:使用參考的模型、數據集和代碼需遵守其作者和維護者提供的相關許可和條款。
RunComfy 是首選的 ComfyUI 平台,提供 ComfyUI 在線 環境和服務,以及 ComfyUI 工作流程 具有驚豔的視覺效果。 RunComfy還提供 AI Playground, 幫助藝術家利用最新的AI工具創作出令人驚艷的藝術作品。