OmniGen2 ComfyUI 工作流程 | 統一的文字生成圖像

OmniGen2 ComfyUI 工作流程是什麼？

OmniGen2 ComfyUI 工作流程將統一的多模態生成帶到您的指尖，將文字生成圖像和基於指令的圖像編輯結合在一個強大的框架中。把它想像成一個創意 AI 助手，不僅能從您的文本描述中生成令人驚嘆的圖像，還能以驚人的準確度理解並執行複雜的編輯命令。

此工作流程利用了一個構建在 Qwen 2.5 VL 基礎上的先進 7B 參數模型，具有獨特的雙路徑 Transformer 架構。這個模型的特別之處在於其解耦設計——使用獨立的路徑進行文本和圖像生成，使其在提供高保真視覺輸出的同時，保持卓越的語言理解能力，忠實於您的創意願景。

OmniGen2 的關鍵特性和優勢

雙重生成模式：OmniGen2 通過直觀的界面，使用自然語言命令從文本創建新圖像或編輯現有圖像。

先進的架構：OmniGen2 的雙路徑設計將文本和圖像處理分開，以達到最佳性能。

組合理解：OmniGen2 在每次生成中都能以卓越的準確度處理複雜的多元素提示。

精確的圖像編輯：使用 OmniGen2 的先進算法進行針對性更改，同時完美保留圖像的其他部分。

多模態反射：OmniGen2 自我分析並改進輸出，以獲得更好的結果。

如何在 ComfyUI 中使用 OmniGen2

OmniGen2 文字生成圖像工作流程

設置圖像尺寸

使用 EmptySD3LatentImage 節點定義 OmniGen2 的輸出尺寸：
- 根據您的 OmniGen2 需求調整寬度和高度
- 保持 batch_size 為 1，以生成單一圖像

編寫您的文本提示

在 OmniGen2 的 CLIP Text Encode (Prompt) 節點中：
- 在第一個編碼器中撰寫詳細的描述性提示
- 第二個編碼器留空或添加負面提示
- OmniGen2 在處理複雜的組合描述時表現出色

生成並保存

點擊 Run 以創建您的 OmniGen2 圖像
VAE Decode 將潛在變量轉換為最終圖像
Save Image 自動將您的 OmniGen2 創作保存到輸出文件夾

OmniGen2 圖像編輯工作流程

上傳您的源圖像

使用 Load Image 節點導入您希望用 OmniGen2 編輯的圖像

撰寫您的編輯指令

在 OmniGen2 的 CLIP Text Encode (Prompt) 節點中：
- 清晰具體地描述您想要的更改
- 例如："將角色的髮色變為自然銀白色"，"添加飛行員太陽鏡"
- 自然語言命令與 OmniGen2 完美契合

配置 OmniGen2 編輯參數

Scale Image to Total Pixels 節點：
- upscale_method: area (在調整大小過程中保持質量)
- megapixels: 2.00 (控制總像素數)
  - 這會將您的圖像調整到約 200 萬像素
  - 例如：將 1920x1080 的圖像調整到保持約 2MP
  - 更高的值=更多細節但處理速度較慢
  - 更低的值=生成速度更快但細節較少
  - 2.00 是編輯能力的最佳選擇 <img src="https://cdn.runcomfy.net/workflow_assets/1247/readme01.webp" alt="OmniGen2" width="650"/>
VAE Encode 將您的縮放圖像轉換為潛在空間

可選：啟用第二個圖像輸入

紫色（繞過）節點允許多圖像操作：
- 按 Ctrl+B 切換繞過模式
- 上傳第二幅圖像以進行風格轉換或對象插入
- 非常適合如 "結合圖像 1 和圖像 2 的元素" 這樣的任務 <img src="https://cdn.runcomfy.net/workflow_assets/1247/readme02.webp" alt="OmniGen2" width="650"/>

生成編輯結果

執行 OmniGen2 工作流程以查看應用的編輯
結果在高保真度下保持準確的指令遵循

致謝

此 ComfyUI 工作流程集成了由北京人工智慧研究院的研究人員開發的突破性 OmniGen2 模型。特別鳴謝這個團隊創建了這個統一的多模態生成系統，推動了 7B 參數模型的可能性界限。這種架構在平衡模型效率與生成質量方面代表了顯著的進步。

關於 OmniGen2 的更多資源

OmniGen2 在開源許可下釋出，免費供研究和商業應用使用。關於 OmniGen2 的更多資訊：

GitHub Repository - 官方實現和模型架構詳細信息：VectorSpaceLab/OmniGen2
Project Page - 綜合概述，包括演示和技術見解：Official Page
ComfyUI Examples - 步驟詳解教程和其他工作流程：ComfyUI Examples

Want More ComfyUI Workflows?

FLUX Kontext Dev | 智能圖像編輯

Kontext Dev = 可控 + 一站式圖形設計需求工具

DreamO | 統一多任務圖像自訂框架

從 1–3 個參考中執行身份、風格、試穿和多條件圖像生成

BAGEL AI | T2I + I2T + I2I

使用開源 AI 的多模態理解與生成。

Step1X-Edit | AI 圖像編輯工具

使用自然語言在 Step1X-Edit 中執行 11 種編輯操作。

Cosmos-Predict2 | Text2Image & Video2World

快速且真實！NVIDIA Cosmos 擁有真實物理效果。

Qwen Image 2512 LoRA 推理 | AI Toolkit ComfyUI

使用 AI Toolkit 訓練的 LoRA 與 Qwen Image 2512 在 ComfyUI 中，通過一個 RCQwenImage2512 節點進行預覽對齊的生成。

MatAnyone 影片去背 | 單一遮罩移除

使用單一遮罩幀去除影片背景，實現完美的主體隔離。

ACE-Step 音樂生成 | AI 音頻創作

通過突破性的擴散技術，以 15 倍速度生成錄音室品質的音樂。

關注我們

支持

資源

法律

RunComfy

RunComfy 是首選的 ComfyUI 平台，提供 ComfyUI 在線環境和服務，以及 ComfyUI 工作流程具有驚豔的視覺效果。 RunComfy還提供 AI Models, 幫助藝術家利用最新的AI工具創作出令人驚艷的藝術作品。

OmniGen2 | 文字生成圖像與編輯