ERNIE-Image ComfyUI 工作流程 | 文本到圖像 AI 生成器

ERNIE-Image ComfyUI Workflow

想要運行這個工作流程嗎？

完全可操作的工作流程
沒有缺失的節點或模型
無需手動設置
具有驚豔的視覺效果

ERNIE-Image ComfyUI Examples

ernie-image-comfyui-workflow-text-to-image-ai-generator-1399-example_01.webp

ernie-image-comfyui-workflow-text-to-image-ai-generator-1399-example_02.webp

ernie-image-comfyui-workflow-text-to-image-ai-generator-1399-example_03.webp

ernie-image-comfyui-workflow-text-to-image-ai-generator-1399-example_04.webp

ernie-image-comfyui-workflow-text-to-image-ai-generator-1399-example_05.webp

ernie-image-comfyui-workflow-text-to-image-ai-generator-1399-example_06.webp

ERNIE-Image ComfyUI: 遵循指令的文本到圖像，具有清晰的文本渲染#

此 ERNIE-Image ComfyUI 工作流程將短提示轉換為高品質的圖像，能夠遵循指令並可靠地渲染文本。它結合了 Comfy-Org 的 ERNIE-Image 擴散模型、強大的文本編碼器、可選的提示增強器和現代的 Flux2 VAE，以保留細節和版式。

設計用於快速迭代，ERNIE-Image ComfyUI 接受您的提示，並可選擇擴展以獲得更豐富的指導，將其編碼，使用 ERNIE-Image 進行採樣，並解碼為最終圖像。提示增強路徑是可選的，您可以在不改變圖形的情況下比較原始與增強的提示。

Comfyui ERNIE-Image ComfyUI 工作流程中的關鍵模型#

ERNIE-Image 擴散模型。核心生成器，將潛在變量去噪為圖像，調整以遵循指令和文本渲染。Model card
Ministral-3-3B 文本編碼器。主要的文本編碼器，將您的提示轉換為 ERNIE-Image 的條件。File
ERNIE-Image 提示增強器。增強分支使用的輔助編碼器，用於將簡潔的提示擴展為描述性指導。File
Flux2 VAE。解碼器，將採樣器的潛在變量轉換為像素，同時保留精細的細節和可辨識的文本。File

如何使用 Comfyui ERNIE-Image ComfyUI 工作流程#

在高層次上，您的提示通過可選的增強步驟，進行編碼，然後由 ERNIE-Image 採樣為潛在變量，最終由 Flux2 VAE 解碼並保存。以下組別直接映射到圖形，使您始終知道在哪裡調整輸入。

提示#

在 ERNIE-Image ComfyUI 子圖的頂層 prompt 欄位中寫下您想看到的內容。清晰、指令性的表述最適合遵循指令和文本渲染。您可以包含希望在圖像中繪製的引號文本。正面條件是從這個提示構建的；負面路徑開始是空的，因此結果往往是忠實的，除非您稍後添加了自己的負面內容。

提示增強#

使用 Enable prompt enhancement? (#76) 打開或關閉增強路徑。開啟時，您的簡短簡報將由 TextGenerate (#74) 使用 ERNIE-Image 提示增強器擴展，通過 Load CLIP (PE) (#91) 加載增強器。增強器使用結構化指令來豐富您的提示，並傳遞目標寬度和高度以鼓勵一致的構圖。ComfySwitchNode (#75) 將原始或增強的文本路由到下游，這樣您可以輕鬆進行 A/B 測試。為了廣泛的兼容性，默認情況下切換是關閉的；一旦增強器模型存在，您可以啟用它。

模型#

工作流程加載三個資產：UNETLoader (#66) 選擇 ERNIE-Image 擴散模型，CLIPLoader (#62) 引入 Ministral-3-3B 文本編碼器，VAELoader (#63) 提供 Flux2 VAE。這種組合使 ERNIE-Image ComfyUI 具有強大的指令遵循性和清晰的版式。如果更換任何模型，請保持三者協調以避免不匹配。

圖像大小#

EmptyFlux2LatentImage (#71) 定義畫布。設置您想要的寬度和高度；風景、肖像和方形圖形都可以工作。這些尺寸也會在切換打開時注入增強提示中，這有助於模型計劃佈局和文本放置。較大的尺寸需要更多計算資源；對於快速預覽，使用較小的尺寸，然後根據需要進行後續放大。

文本到圖像#

CLIPTextEncode (#67) 將路由的提示轉換為正面條件，而 CLIPTextEncode (#72) 提供負面分支（默認情況下為空白）。KSampler (#70) 然後使用 ERNIE-Image 模型和您的條件生成潛在變量。在採樣後，VAEDecode (#65) 將潛在變量轉換為 RGB 像素。所有內容均已連接以進行一鍵生成，因此一旦設置好輸入，只需排隊工作並查看預覽。

輸出#

圖像由 SaveImage (#73) 保存。您將在 UI 預覽中看到它並在輸出目錄中找到。使用一致的種子來比較增強開啟與關閉的情況，以隔離文本分支的效果。

Comfyui ERNIE-Image ComfyUI 工作流程中的關鍵節點#

KSampler (#70) 主要生成器，控制擴散軌跡。調整 steps 以平衡質量與速度，使用 cfg 收緊或放鬆提示的遵循性，並設置固定的 seed 以在提示變體中保持可重現性。較高的指導可以提高遵循性，但可能會降低創造力；根據口味進行平衡。請參閱 ComfyUI 的採樣器參考以獲取一般行為。ComfyUI

UNETLoader (#66) 加載實際將潛在變量去噪為圖像的 ERNIE-Image 擴散模型。將此設置為 ERNIE-Image 檢查點以受益於指令遵循和文本渲染。如果更換模型，預期風格和版式能力會改變。ERNIE-Image

CLIPLoader (#62) 提供 Ministral-3-3B 文本編碼器，用於主要條件路徑。更換編碼器會改變語言映射到視覺的方式；為了忠實地遵循指令，請保持其與 ERNIE-Image 堆疊對齊。此節點影響下游的正面和負面編碼器。Ministral-3-3B file

VAELoader (#63) 提供解碼過程中的 Flux2 VAE。匹配的 VAE 保留顏色和邊緣的保真度，並幫助保持渲染文本的清晰度。使用此功能生成 ERNIE-Image 以獲得最佳效果。Flux2 VAE file

EmptyFlux2LatentImage (#71) 在您選擇的分辨率下初始化一個空的潛在畫布。這設置了最終的圖像大小並微妙地引導佈局。更改尺寸也會在激活該路徑時更新增強器的內部指令。

CLIPTextEncode (#67) 將最終路由的提示編碼為正面條件。為了改善文本渲染，請包括您希望出現的準確單詞並指定大小寫（如果重要）。保持指令簡潔具體以獲得最佳遵循性。

CLIPTextEncode (#72) 編碼負面提示。默認情況下為空白以保持輸出接近您的意圖。如果您注意到不需要的工件，請在此添加幾個簡潔的負面術語。

TextGenerate (#74) 使用由 Load CLIP (PE) (#91) 加載的 ERNIE-Image 提示增強器生成擴展描述。用於將簡短的簡報轉換為豐富的視覺指導，以改善構圖和細節。保持增強切換關閉以獲得字面控制，開啟以獲得描述性變化。Prompt Enhancer file

ComfySwitchNode (#75) 根據 Enable prompt enhancement? (#76) 將原始或增強的提示路由到前端。這使得 A/B 測試變得簡單，而無需更改連接。在比較時使用固定的 seed 以隔離僅提示的差異。

VAEDecode (#65) 使用 Flux2 VAE 將最終潛在變量解碼為圖像。此步驟強烈影響顏色、清晰度以及小文本的可讀性。保持其與 ERNIE-Image 堆疊中的 Flux2 VAE 配對。

SaveImage (#73) 將生成的圖像寫入磁盤並在 UI 中曝光。如果您計劃基準多次 ERNIE-Image ComfyUI 運行，請使用一致的命名約定。

可選附加功能#

為了得到清晰的字母，將準確的單詞放在引號中並指定風格提示，如“粗體襯線標籤”或“手寫標籤”；ERNIE-Image ComfyUI 優化了文本渲染。
使用清晰的指令，如“居中產品照片”、“白色背景”或“2:3 海報佈局”，以便 ERNIE-Image ComfyUI 能夠精確地遵循指令。
當比較增強路徑時，鎖定 seed 並僅切換增強開關以查看真實的 A/B 差異。
選擇與場景匹配的縱橫比；ERNIE-Image ComfyUI 會尊重尺寸提示並相應地計劃佈局。

致謝#

此工作流程實施並建立在以下作品和資源之上。我們感謝 Comfy-Org 提供 ERNIE-Image（重新打包的模型文件和資產），百度提供原始 ERNIE-Image 模型，以及 ComfyUI 團隊提供的 ERNIE-Image ComfyUI 工作流程示例的貢獻和維護。欲了解詳情，請參閱下方連結的原始文檔和存儲庫。

資源#

ComfyUI/ERNIE-Image ComfyUI 工作流程源
- GitHub: comfy-org/docs
- Docs / Release Notes: ERNIE-Image ComfyUI workflow example
Comfy-Org/ERNIE-Image
- GitHub: baidu/ERNIE-Image
- Hugging Face: Comfy-Org/ERNIE-Image
Comfy-Org/ernie-image.safetensors
- GitHub: baidu/ERNIE-Image
- Hugging Face: ernie-image.safetensors
Comfy-Org/ministral-3-3b.safetensors
- GitHub: baidu/ERNIE-Image
- Hugging Face: ministral-3-3b.safetensors
Comfy-Org/ernie-image-prompt-enhancer.safetensors
- GitHub: baidu/ERNIE-Image
- Hugging Face: ernie-image-prompt-enhancer.safetensors
Comfy-Org/flux2-vae.safetensors
- GitHub: baidu/ERNIE-Image
- Hugging Face: flux2-vae.safetensors

注意：使用所引用的模型、數據集和代碼需遵循其作者和維護者提供的相應許可和條款。

Want More ComfyUI Workflows?

Qwen-Image | HD 多文字海報生成器

影像文字生成的新紀元！

FLUX | 新的藝術圖像生成

由 Black Forest Labs 開發的新圖像生成模型

ComfyUI VNCCS 克隆 | 一致性角色生成器

快速克隆角色，獲得穩定、高品質的精靈準備結果。

LTX 2.3 VBVR | 上下文感知視頻生成器

為每個生成的視頻序列添加邏輯和流程。

VACE Wan2.1 | V2V

使用VACE Wan2.1將視頻轉換為參考風格圖像。

ACE-Step 音樂生成 | AI 音頻創作

通過突破性的擴散技術，以 15 倍速度生成錄音室品質的音樂。

Wan 2.1 影片重塑 | 一致的影片風格轉換

通過使用 Wan 2.1 影片重塑工作流程應用重塑的首幀來轉換您的影片風格。

Bernini 影片編輯專家 | 多模態生成器

將您的影片轉化為智能身份識別的傑作。

關注我們

支持

資源

法律

RunComfy

RunComfy 是首選的 ComfyUI 平台，提供 ComfyUI 在線環境和服務，以及 ComfyUI 工作流程具有驚豔的視覺效果。 RunComfy還提供 AI Models, 幫助藝術家利用最新的AI工具創作出令人驚艷的藝術作品。

ERNIE-Image ComfyUI | 智能文本到圖像生成器