logo
RunComfy
  • ComfyUI
  • 訓練器新
  • 模型
  • API
  • 定價
discord logo
ComfyUI>工作流程>ERNIE-Image ComfyUI | 智能文本到圖像生成器

ERNIE-Image ComfyUI | 智能文本到圖像生成器

Workflow Name: RunComfy/ERNIE-Image-ComfyUI
Workflow ID: 0000...1399
此工作流程幫助您在幾秒鐘內將文本指令轉換為清晰、詳細的圖像。使用官方的 ERNIE 模型堆疊構建,能準確捕捉提示並支持視覺輸出中的精確文本渲染。設計師可以輕鬆自定義提示和構圖以滿足特定美學需求。Ministral 和 Flux2 VAE 的整合確保了精細的細節和流暢的擴散質量。非常適合輕鬆創建概念視覺、品牌資產和遵循指令的設計。

ERNIE-Image ComfyUI: 遵循指令的文本到圖像,具有清晰的文本渲染

此 ERNIE-Image ComfyUI 工作流程將短提示轉換為高品質的圖像,能夠遵循指令並可靠地渲染文本。它結合了 Comfy-Org 的 ERNIE-Image 擴散模型、強大的文本編碼器、可選的提示增強器和現代的 Flux2 VAE,以保留細節和版式。

設計用於快速迭代,ERNIE-Image ComfyUI 接受您的提示,並可選擇擴展以獲得更豐富的指導,將其編碼,使用 ERNIE-Image 進行採樣,並解碼為最終圖像。提示增強路徑是可選的,您可以在不改變圖形的情況下比較原始與增強的提示。

Comfyui ERNIE-Image ComfyUI 工作流程中的關鍵模型

  • ERNIE-Image 擴散模型。核心生成器,將潛在變量去噪為圖像,調整以遵循指令和文本渲染。Model card
  • Ministral-3-3B 文本編碼器。主要的文本編碼器,將您的提示轉換為 ERNIE-Image 的條件。File
  • ERNIE-Image 提示增強器。增強分支使用的輔助編碼器,用於將簡潔的提示擴展為描述性指導。File
  • Flux2 VAE。解碼器,將採樣器的潛在變量轉換為像素,同時保留精細的細節和可辨識的文本。File

如何使用 Comfyui ERNIE-Image ComfyUI 工作流程

在高層次上,您的提示通過可選的增強步驟,進行編碼,然後由 ERNIE-Image 採樣為潛在變量,最終由 Flux2 VAE 解碼並保存。以下組別直接映射到圖形,使您始終知道在哪裡調整輸入。

提示

在 ERNIE-Image ComfyUI 子圖的頂層 prompt 欄位中寫下您想看到的內容。清晰、指令性的表述最適合遵循指令和文本渲染。您可以包含希望在圖像中繪製的引號文本。正面條件是從這個提示構建的;負面路徑開始是空的,因此結果往往是忠實的,除非您稍後添加了自己的負面內容。

提示增強

使用 Enable prompt enhancement? (#76) 打開或關閉增強路徑。開啟時,您的簡短簡報將由 TextGenerate (#74) 使用 ERNIE-Image 提示增強器擴展,通過 Load CLIP (PE) (#91) 加載增強器。增強器使用結構化指令來豐富您的提示,並傳遞目標寬度和高度以鼓勵一致的構圖。ComfySwitchNode (#75) 將原始或增強的文本路由到下游,這樣您可以輕鬆進行 A/B 測試。為了廣泛的兼容性,默認情況下切換是關閉的;一旦增強器模型存在,您可以啟用它。

模型

工作流程加載三個資產:UNETLoader (#66) 選擇 ERNIE-Image 擴散模型,CLIPLoader (#62) 引入 Ministral-3-3B 文本編碼器,VAELoader (#63) 提供 Flux2 VAE。這種組合使 ERNIE-Image ComfyUI 具有強大的指令遵循性和清晰的版式。如果更換任何模型,請保持三者協調以避免不匹配。

圖像大小

EmptyFlux2LatentImage (#71) 定義畫布。設置您想要的寬度和高度;風景、肖像和方形圖形都可以工作。這些尺寸也會在切換打開時注入增強提示中,這有助於模型計劃佈局和文本放置。較大的尺寸需要更多計算資源;對於快速預覽,使用較小的尺寸,然後根據需要進行後續放大。

文本到圖像

CLIPTextEncode (#67) 將路由的提示轉換為正面條件,而 CLIPTextEncode (#72) 提供負面分支(默認情況下為空白)。KSampler (#70) 然後使用 ERNIE-Image 模型和您的條件生成潛在變量。在採樣後,VAEDecode (#65) 將潛在變量轉換為 RGB 像素。所有內容均已連接以進行一鍵生成,因此一旦設置好輸入,只需排隊工作並查看預覽。

輸出

圖像由 SaveImage (#73) 保存。您將在 UI 預覽中看到它並在輸出目錄中找到。使用一致的種子來比較增強開啟與關閉的情況,以隔離文本分支的效果。

Comfyui ERNIE-Image ComfyUI 工作流程中的關鍵節點

KSampler (#70) 主要生成器,控制擴散軌跡。調整 steps 以平衡質量與速度,使用 cfg 收緊或放鬆提示的遵循性,並設置固定的 seed 以在提示變體中保持可重現性。較高的指導可以提高遵循性,但可能會降低創造力;根據口味進行平衡。請參閱 ComfyUI 的採樣器參考以獲取一般行為。ComfyUI

UNETLoader (#66) 加載實際將潛在變量去噪為圖像的 ERNIE-Image 擴散模型。將此設置為 ERNIE-Image 檢查點以受益於指令遵循和文本渲染。如果更換模型,預期風格和版式能力會改變。ERNIE-Image

CLIPLoader (#62) 提供 Ministral-3-3B 文本編碼器,用於主要條件路徑。更換編碼器會改變語言映射到視覺的方式;為了忠實地遵循指令,請保持其與 ERNIE-Image 堆疊對齊。此節點影響下游的正面和負面編碼器。Ministral-3-3B file

VAELoader (#63) 提供解碼過程中的 Flux2 VAE。匹配的 VAE 保留顏色和邊緣的保真度,並幫助保持渲染文本的清晰度。使用此功能生成 ERNIE-Image 以獲得最佳效果。Flux2 VAE file

EmptyFlux2LatentImage (#71) 在您選擇的分辨率下初始化一個空的潛在畫布。這設置了最終的圖像大小並微妙地引導佈局。更改尺寸也會在激活該路徑時更新增強器的內部指令。

CLIPTextEncode (#67) 將最終路由的提示編碼為正面條件。為了改善文本渲染,請包括您希望出現的準確單詞並指定大小寫(如果重要)。保持指令簡潔具體以獲得最佳遵循性。

CLIPTextEncode (#72) 編碼負面提示。默認情況下為空白以保持輸出接近您的意圖。如果您注意到不需要的工件,請在此添加幾個簡潔的負面術語。

TextGenerate (#74) 使用由 Load CLIP (PE) (#91) 加載的 ERNIE-Image 提示增強器生成擴展描述。用於將簡短的簡報轉換為豐富的視覺指導,以改善構圖和細節。保持增強切換關閉以獲得字面控制,開啟以獲得描述性變化。Prompt Enhancer file

ComfySwitchNode (#75) 根據 Enable prompt enhancement? (#76) 將原始或增強的提示路由到前端。這使得 A/B 測試變得簡單,而無需更改連接。在比較時使用固定的 seed 以隔離僅提示的差異。

VAEDecode (#65) 使用 Flux2 VAE 將最終潛在變量解碼為圖像。此步驟強烈影響顏色、清晰度以及小文本的可讀性。保持其與 ERNIE-Image 堆疊中的 Flux2 VAE 配對。

SaveImage (#73) 將生成的圖像寫入磁盤並在 UI 中曝光。如果您計劃基準多次 ERNIE-Image ComfyUI 運行,請使用一致的命名約定。

可選附加功能

  • 為了得到清晰的字母,將準確的單詞放在引號中並指定風格提示,如“粗體襯線標籤”或“手寫標籤”;ERNIE-Image ComfyUI 優化了文本渲染。
  • 使用清晰的指令,如“居中產品照片”、“白色背景”或“2:3 海報佈局”,以便 ERNIE-Image ComfyUI 能夠精確地遵循指令。
  • 當比較增強路徑時,鎖定 seed 並僅切換增強開關以查看真實的 A/B 差異。
  • 選擇與場景匹配的縱橫比;ERNIE-Image ComfyUI 會尊重尺寸提示並相應地計劃佈局。

致謝

此工作流程實施並建立在以下作品和資源之上。我們感謝 Comfy-Org 提供 ERNIE-Image(重新打包的模型文件和資產),百度提供原始 ERNIE-Image 模型,以及 ComfyUI 團隊提供的 ERNIE-Image ComfyUI 工作流程示例的貢獻和維護。欲了解詳情,請參閱下方連結的原始文檔和存儲庫。

資源

  • ComfyUI/ERNIE-Image ComfyUI 工作流程源
    • GitHub: comfy-org/docs
    • Docs / Release Notes: ERNIE-Image ComfyUI workflow example
  • Comfy-Org/ERNIE-Image
    • GitHub: baidu/ERNIE-Image
    • Hugging Face: Comfy-Org/ERNIE-Image
  • Comfy-Org/ernie-image.safetensors
    • GitHub: baidu/ERNIE-Image
    • Hugging Face: ernie-image.safetensors
  • Comfy-Org/ministral-3-3b.safetensors
    • GitHub: baidu/ERNIE-Image
    • Hugging Face: ministral-3-3b.safetensors
  • Comfy-Org/ernie-image-prompt-enhancer.safetensors
    • GitHub: baidu/ERNIE-Image
    • Hugging Face: ernie-image-prompt-enhancer.safetensors
  • Comfy-Org/flux2-vae.safetensors
    • GitHub: baidu/ERNIE-Image
    • Hugging Face: flux2-vae.safetensors

注意:使用所引用的模型、數據集和代碼需遵循其作者和維護者提供的相應許可和條款。

Want More ComfyUI Workflows?

Qwen-Image | HD 多文字海報生成器

Qwen-Image | HD 多文字海報生成器

影像文字生成的新紀元!

FLUX | 新的藝術圖像生成

FLUX | 新的藝術圖像生成

由 Black Forest Labs 開發的新圖像生成模型

ACE-Step 1.5XL Turbo comfyui 工作流程 | 文字轉音樂生成器

快速且清晰地將您的文字轉換為驚人的音樂。

Wan 2.1 LoRA

使用 LoRA 模型增強 Wan 2.1 視頻生成,提升風格和可自訂性。

Qwen Image Edit Plus 2509 LoRA 推理 | AI Toolkit ComfyUI

使用單個 RCQwenImageEditPlus 自訂節點,在 ComfyUI 中應用 AI Toolkit 訓練的 Qwen Image Edit Plus 2509 LoRA,並進行預覽對齊的編輯。

InstantID | 肖像轉化為藝術

InstantID | 肖像轉化為藝術

InstantID精確地增強和轉化肖像,具有風格和美學吸引力。

Wan 2.1 影片重塑 | 一致的影片風格轉換

通過使用 Wan 2.1 影片重塑工作流程應用重塑的首幀來轉換您的影片風格。

AnimateDiff + AutoMask + ControlNet | 視覺效果 (VFX)

使用 AnimateDiff、AutoMask 和 ControlNet 增強 VFX,實現精確、可控的效果。

關注我們
  • 領英
  • Facebook
  • Instagram
  • Twitter
支持
  • Discord
  • 電子郵件
  • 系統狀態
  • 附屬
資源
  • 免費 ComfyUI 在線版
  • ComfyUI 指南
  • RunComfy API
  • RunComfy MCP
  • ComfyUI 教程
  • ComfyUI 節點
  • 了解更多
法律
  • 服務條款
  • 隱私政策
  • Cookie 政策
RunComfy
版權 2026 RunComfy. 保留所有權利。

RunComfy 是首選的 ComfyUI 平台,提供 ComfyUI 在線 環境和服務,以及 ComfyUI 工作流程 具有驚豔的視覺效果。 RunComfy還提供 AI Models, 幫助藝術家利用最新的AI工具創作出令人驚艷的藝術作品。