ComfyUI  >  工作流程  >  OmniGen2 | 文字生成圖像與編輯

OmniGen2 | 文字生成圖像與編輯

體驗 OmniGen2 在 ComfyUI 中統一多模態生成的強大功能。此工作流程使用具有雙路徑 Transformer 架構的 7B 參數模型,提供卓越的文字生成圖像和文字引導的圖像編輯。基於 Qwen 2.5 VL 基礎,OmniGen2 擅長組合理解、長提示跟隨,以及在保持視覺質量和一致性的同時進行精確的圖像修改。

ComfyUI OmniGen2 工作流程

OmniGen2 ComfyUI Workflow | Unified Text-to-Image Generation
想要運行這個工作流程嗎?
  • 完全可操作的工作流程
  • 沒有缺失的節點或模型
  • 無需手動設置
  • 具有驚豔的視覺效果

ComfyUI OmniGen2 範例

omnigen2-comfyui-workflow-unified-text-to-image-generation-1247-example_01.webp
omnigen2-comfyui-workflow-unified-text-to-image-generation-1247-example_02.webp
omnigen2-comfyui-workflow-unified-text-to-image-generation-1247-example_03.webp
omnigen2-comfyui-workflow-unified-text-to-image-generation-1247-example_04.webp

ComfyUI OmniGen2 說明

OmniGen2 ComfyUI 工作流程是什麼?

OmniGen2 ComfyUI 工作流程將統一的多模態生成帶到您的指尖,將文字生成圖像和基於指令的圖像編輯結合在一個強大的框架中。把它想像成一個創意 AI 助手,不僅能從您的文本描述中生成令人驚嘆的圖像,還能以驚人的準確度理解並執行複雜的編輯命令。

此工作流程利用了一個構建在 Qwen 2.5 VL 基礎上的先進 7B 參數模型,具有獨特的雙路徑 Transformer 架構。這個模型的特別之處在於其解耦設計——使用獨立的路徑進行文本和圖像生成,使其在提供高保真視覺輸出的同時,保持卓越的語言理解能力,忠實於您的創意願景。

OmniGen2 的關鍵特性和優勢

雙重生成模式:OmniGen2 通過直觀的界面,使用自然語言命令從文本創建新圖像或編輯現有圖像。

先進的架構:OmniGen2 的雙路徑設計將文本和圖像處理分開,以達到最佳性能。

組合理解:OmniGen2 在每次生成中都能以卓越的準確度處理複雜的多元素提示。

精確的圖像編輯:使用 OmniGen2 的先進算法進行針對性更改,同時完美保留圖像的其他部分。

多模態反射:OmniGen2 自我分析並改進輸出,以獲得更好的結果。

如何在 ComfyUI 中使用 OmniGen2

OmniGen2 文字生成圖像工作流程

設置圖像尺寸

  • 使用 EmptySD3LatentImage 節點定義 OmniGen2 的輸出尺寸:
    • 根據您的 OmniGen2 需求調整寬度和高度
    • 保持 batch_size 為 1,以生成單一圖像

編寫您的文本提示

  • 在 OmniGen2 的 CLIP Text Encode (Prompt) 節點中:
    • 在第一個編碼器中撰寫詳細的描述性提示
    • 第二個編碼器留空或添加負面提示
    • OmniGen2 在處理複雜的組合描述時表現出色

生成並保存

  • 點擊 Run 以創建您的 OmniGen2 圖像
  • VAE Decode 將潛在變量轉換為最終圖像
  • Save Image 自動將您的 OmniGen2 創作保存到輸出文件夾

OmniGen2 圖像編輯工作流程

上傳您的源圖像

  • 使用 Load Image 節點導入您希望用 OmniGen2 編輯的圖像
OmniGen2

撰寫您的編輯指令

  • 在 OmniGen2 的 CLIP Text Encode (Prompt) 節點中:
    • 清晰具體地描述您想要的更改
    • 例如:"將角色的髮色變為自然銀白色","添加飛行員太陽鏡"
    • 自然語言命令與 OmniGen2 完美契合

配置 OmniGen2 編輯參數

  • Scale Image to Total Pixels 節點:
    • upscale_method: area (在調整大小過程中保持質量)
    • megapixels: 2.00 (控制總像素數)
      • 這會將您的圖像調整到約 200 萬像素
      • 例如:將 1920x1080 的圖像調整到保持約 2MP
      • 更高的值=更多細節但處理速度較慢
      • 更低的值=生成速度更快但細節較少
      • 2.00 是編輯能力的最佳選擇
      OmniGen2
  • VAE Encode 將您的縮放圖像轉換為潛在空間

可選:啟用第二個圖像輸入

  • 紫色(繞過)節點允許多圖像操作:
    • 按 Ctrl+B 切換繞過模式
    • 上傳第二幅圖像以進行風格轉換或對象插入
    • 非常適合如 "結合圖像 1 和圖像 2 的元素" 這樣的任務
    OmniGen2

生成編輯結果

  • 執行 OmniGen2 工作流程以查看應用的編輯
  • 結果在高保真度下保持準確的指令遵循

致謝

此 ComfyUI 工作流程集成了由北京人工智慧研究院的研究人員開發的突破性 OmniGen2 模型。特別鳴謝這個團隊創建了這個統一的多模態生成系統,推動了 7B 參數模型的可能性界限。這種架構在平衡模型效率與生成質量方面代表了顯著的進步。

關於 OmniGen2 的更多資源

OmniGen2 在開源許可下釋出,免費供研究和商業應用使用。關於 OmniGen2 的更多資訊:

  • GitHub Repository - 官方實現和模型架構詳細信息:
  • Project Page - 綜合概述,包括演示和技術見解:
  • ComfyUI Examples - 步驟詳解教程和其他工作流程:

想要更多 ComfyUI 工作流程嗎?

RunComfy
版權 2025 RunComfy. 保留所有權利。

RunComfy 是首選的 ComfyUI 平台,提供 ComfyUI 在線 環境和服務,以及 ComfyUI 工作流程 具有驚豔的視覺效果。 RunComfy還提供 AI Playground, 幫助藝術家利用最新的AI工具創作出令人驚艷的藝術作品。