ComfyUI  >  工作流  >  OmniGen2 | 文本到图像 & 编辑

OmniGen2 | 文本到图像 & 编辑

体验 OmniGen2 在 ComfyUI 中统一多模态生成的强大功能。此工作流使用 7B 参数模型和双路径 Transformer 架构,提供卓越的文本到图像生成和文本引导的图像编辑。基于 Qwen 2.5 VL 基础,OmniGen2 擅长组合理解、长提示跟随和精确的图像修改,同时保持视觉质量和一致性。

ComfyUI OmniGen2 工作流程

OmniGen2 ComfyUI Workflow | Unified Text-to-Image Generation
想要运行这个工作流吗?
  • 完全可操作的工作流
  • 没有缺失的节点或模型
  • 无需手动设置
  • 具有惊艳的视觉效果

ComfyUI OmniGen2 示例

omnigen2-comfyui-workflow-unified-text-to-image-generation-1247-example_01.webp
omnigen2-comfyui-workflow-unified-text-to-image-generation-1247-example_02.webp
omnigen2-comfyui-workflow-unified-text-to-image-generation-1247-example_03.webp
omnigen2-comfyui-workflow-unified-text-to-image-generation-1247-example_04.webp

ComfyUI OmniGen2 描述

什么是 OmniGen2 ComfyUI 工作流?

OmniGen2 ComfyUI 工作流将统一的多模态生成带到您的指尖,将文本到图像合成和基于指令的图像编辑结合在一个强大的框架中。可以将其视为一个创意 AI 助手,不仅可以从您的文本描述中生成惊人的图像,还能以惊人的精确度理解和执行复杂的编辑命令。

该工作流利用了一个复杂的 7B 参数模型,建立在 Qwen 2.5 VL 基础之上,具有独特的双路径 Transformer 架构。这个模型的特别之处在于其解耦设计 - 使用独立的路径进行文本和图像生成,使其在保持卓越语言理解的同时,提供高保真视觉输出,忠实于您的创意愿景。

OmniGen2 的关键特性和优势

双生成模式:OmniGen2 通过直观的界面,使用自然语言命令从文本创建新图像或编辑现有图像。

先进的架构:OmniGen2 的双路径设计将文本和图像处理分开,以实现最佳性能。

组合理解:OmniGen2 以卓越的准确性处理复杂的多元素提示。

精确的图像编辑:使用 OmniGen2 的高级算法进行有针对性的更改,同时完美保留图像的其他部分。

多模态反思:OmniGen2 自我分析和优化输出以提高结果。

如何在 ComfyUI 中使用 OmniGen2

OmniGen2 文本到图像工作流

设置图像尺寸

  • 使用 EmptySD3LatentImage 节点定义 OmniGen2 的输出大小:
    • 根据您的 OmniGen2 需求调整宽度和高度
    • 将 batch_size 保持为 1 以生成单张图像

制作您的文本提示

  • 在 OmniGen2 的 CLIP Text Encode (Prompt) 节点中:
    • 在第一个编码器中编写详细的描述性提示
    • 将第二个编码器留空或添加负面提示
    • OmniGen2 在复杂的组合描述中表现出色

生成并保存

  • 点击 Run 生成您的 OmniGen2 图像
  • VAE Decode 将潜在变量转换为最终图像
  • Save Image 自动将您的 OmniGen2 创作保存到输出文件夹

OmniGen2 图像编辑工作流

上传您的源图像

  • 使用 Load Image 节点导入您想用 OmniGen2 编辑的图像
OmniGen2

编写您的编辑指令

  • 在 OmniGen2 的 CLIP Text Encode (Prompt) 节点中:
    • 清晰具体地描述您想要的更改
    • 示例:"将角色的发色变为自然的银白色","添加飞行员太阳镜"
    • 自然语言命令与 OmniGen2 完美配合

配置 OmniGen2 编辑参数

  • Scale Image to Total Pixels 节点:
    • upscale_method:area(在调整大小时保持质量)
    • megapixels:2.00(控制像素总数)
      • 这会将您的图像调整到大约 200 万像素的总数
      • 例如:会将 1920x1080 图像缩放以保持约 2MP
      • 更高的值 = 更多细节但处理速度较慢
      • 更低的值 = 生成速度较快但细节较少
      • 2.00 是编辑能力的最佳选择
      OmniGen2
  • VAE Encode 将您的缩放图像转换为潜在空间

可选:启用第二个图像输入

  • 紫色(绕过)节点允许多图像操作:
    • 按 Ctrl+B 切换绕过模式
    • 上传第二张图像以进行风格转移或对象插入
    • 非常适合 "合并图像 1 和图像 2 的元素" 之类的任务
    OmniGen2

生成编辑结果

  • 执行 OmniGen2 工作流以查看应用的编辑
  • 结果在保持高保真度的同时,精确遵循指令

致谢

此 ComfyUI 工作流整合了由北京人工智能研究院研究人员开发的开创性 OmniGen2 模型。特别感谢团队创建了这个推动 7B 参数模型可能性的统一多模态生成系统。该架构在平衡模型效率与生成质量方面代表了显著的进步。

更多关于 OmniGen2 的资源

OmniGen2 在开源许可下发布,使其可自由用于研究和商业应用。有关 OmniGen2 的更多信息:

  • GitHub Repository - 官方实现和模型架构详情:
  • Project Page - 综合概述,包含演示和技术见解:
  • ComfyUI Examples - 分步教程和附加工作流:

想要更多 ComfyUI 工作流吗?

RunComfy
版权 2025 RunComfy. 保留所有权利。

RunComfy 是首选的 ComfyUI 平台,提供 ComfyUI 在线 环境和服务,以及 ComfyUI 工作流 具有惊艳的视觉效果。 RunComfy还提供 AI Playground, 帮助艺术家利用最新的AI工具创作出令人惊叹的艺术作品。