OmniGen2 | 文字生成圖像與編輯
體驗 OmniGen2 在 ComfyUI 中統一多模態生成的強大功能。此工作流程使用具有雙路徑 Transformer 架構的 7B 參數模型,提供卓越的文字生成圖像和文字引導的圖像編輯。基於 Qwen 2.5 VL 基礎,OmniGen2 擅長組合理解、長提示跟隨,以及在保持視覺質量和一致性的同時進行精確的圖像修改。ComfyUI OmniGen2 工作流程
ComfyUI OmniGen2 範例




ComfyUI OmniGen2 說明
OmniGen2 ComfyUI 工作流程是什麼?
OmniGen2 ComfyUI 工作流程將統一的多模態生成帶到您的指尖,將文字生成圖像和基於指令的圖像編輯結合在一個強大的框架中。把它想像成一個創意 AI 助手,不僅能從您的文本描述中生成令人驚嘆的圖像,還能以驚人的準確度理解並執行複雜的編輯命令。
此工作流程利用了一個構建在 Qwen 2.5 VL 基礎上的先進 7B 參數模型,具有獨特的雙路徑 Transformer 架構。這個模型的特別之處在於其解耦設計——使用獨立的路徑進行文本和圖像生成,使其在提供高保真視覺輸出的同時,保持卓越的語言理解能力,忠實於您的創意願景。
OmniGen2 的關鍵特性和優勢
雙重生成模式:OmniGen2 通過直觀的界面,使用自然語言命令從文本創建新圖像或編輯現有圖像。
先進的架構:OmniGen2 的雙路徑設計將文本和圖像處理分開,以達到最佳性能。
組合理解:OmniGen2 在每次生成中都能以卓越的準確度處理複雜的多元素提示。
精確的圖像編輯:使用 OmniGen2 的先進算法進行針對性更改,同時完美保留圖像的其他部分。
多模態反射:OmniGen2 自我分析並改進輸出,以獲得更好的結果。
如何在 ComfyUI 中使用 OmniGen2
OmniGen2 文字生成圖像工作流程
設置圖像尺寸
- 使用 EmptySD3LatentImage 節點定義 OmniGen2 的輸出尺寸:
- 根據您的 OmniGen2 需求調整寬度和高度
- 保持 batch_size 為 1,以生成單一圖像
編寫您的文本提示
- 在 OmniGen2 的 CLIP Text Encode (Prompt) 節點中:
- 在第一個編碼器中撰寫詳細的描述性提示
- 第二個編碼器留空或添加負面提示
- OmniGen2 在處理複雜的組合描述時表現出色
生成並保存
- 點擊
Run
以創建您的 OmniGen2 圖像 - VAE Decode 將潛在變量轉換為最終圖像
- Save Image 自動將您的 OmniGen2 創作保存到輸出文件夾
OmniGen2 圖像編輯工作流程
上傳您的源圖像
- 使用 Load Image 節點導入您希望用 OmniGen2 編輯的圖像

撰寫您的編輯指令
- 在 OmniGen2 的 CLIP Text Encode (Prompt) 節點中:
- 清晰具體地描述您想要的更改
- 例如:"將角色的髮色變為自然銀白色","添加飛行員太陽鏡"
- 自然語言命令與 OmniGen2 完美契合
配置 OmniGen2 編輯參數
- Scale Image to Total Pixels 節點:
- upscale_method: area (在調整大小過程中保持質量)
- megapixels: 2.00 (控制總像素數)
- 這會將您的圖像調整到約 200 萬像素
- 例如:將 1920x1080 的圖像調整到保持約 2MP
- 更高的值=更多細節但處理速度較慢
- 更低的值=生成速度更快但細節較少
- 2.00 是編輯能力的最佳選擇
- VAE Encode 將您的縮放圖像轉換為潛在空間
可選:啟用第二個圖像輸入
- 紫色(繞過)節點允許多圖像操作:
- 按 Ctrl+B 切換繞過模式
- 上傳第二幅圖像以進行風格轉換或對象插入
- 非常適合如 "結合圖像 1 和圖像 2 的元素" 這樣的任務
生成編輯結果
- 執行 OmniGen2 工作流程以查看應用的編輯
- 結果在高保真度下保持準確的指令遵循
致謝
此 ComfyUI 工作流程集成了由北京人工智慧研究院的研究人員開發的突破性 OmniGen2 模型。特別鳴謝這個團隊創建了這個統一的多模態生成系統,推動了 7B 參數模型的可能性界限。這種架構在平衡模型效率與生成質量方面代表了顯著的進步。
關於 OmniGen2 的更多資源
OmniGen2 在開源許可下釋出,免費供研究和商業應用使用。關於 OmniGen2 的更多資訊:
- GitHub Repository - 官方實現和模型架構詳細信息:
- Project Page - 綜合概述,包括演示和技術見解:
- ComfyUI Examples - 步驟詳解教程和其他工作流程:
想要更多 ComfyUI 工作流程嗎?
RunComfy 是首選的 ComfyUI 平台,提供 ComfyUI 在線 環境和服務,以及 ComfyUI 工作流程 具有驚豔的視覺效果。 RunComfy還提供 AI Playground, 幫助藝術家利用最新的AI工具創作出令人驚艷的藝術作品。