OmniGen2 | 文本到图像 & 编辑
体验 OmniGen2 在 ComfyUI 中统一多模态生成的强大功能。此工作流使用 7B 参数模型和双路径 Transformer 架构,提供卓越的文本到图像生成和文本引导的图像编辑。基于 Qwen 2.5 VL 基础,OmniGen2 擅长组合理解、长提示跟随和精确的图像修改,同时保持视觉质量和一致性。ComfyUI OmniGen2 工作流程
ComfyUI OmniGen2 示例




ComfyUI OmniGen2 描述
什么是 OmniGen2 ComfyUI 工作流?
OmniGen2 ComfyUI 工作流将统一的多模态生成带到您的指尖,将文本到图像合成和基于指令的图像编辑结合在一个强大的框架中。可以将其视为一个创意 AI 助手,不仅可以从您的文本描述中生成惊人的图像,还能以惊人的精确度理解和执行复杂的编辑命令。
该工作流利用了一个复杂的 7B 参数模型,建立在 Qwen 2.5 VL 基础之上,具有独特的双路径 Transformer 架构。这个模型的特别之处在于其解耦设计 - 使用独立的路径进行文本和图像生成,使其在保持卓越语言理解的同时,提供高保真视觉输出,忠实于您的创意愿景。
OmniGen2 的关键特性和优势
双生成模式:OmniGen2 通过直观的界面,使用自然语言命令从文本创建新图像或编辑现有图像。
先进的架构:OmniGen2 的双路径设计将文本和图像处理分开,以实现最佳性能。
组合理解:OmniGen2 以卓越的准确性处理复杂的多元素提示。
精确的图像编辑:使用 OmniGen2 的高级算法进行有针对性的更改,同时完美保留图像的其他部分。
多模态反思:OmniGen2 自我分析和优化输出以提高结果。
如何在 ComfyUI 中使用 OmniGen2
OmniGen2 文本到图像工作流
设置图像尺寸
- 使用 EmptySD3LatentImage 节点定义 OmniGen2 的输出大小:
- 根据您的 OmniGen2 需求调整宽度和高度
- 将 batch_size 保持为 1 以生成单张图像
制作您的文本提示
- 在 OmniGen2 的 CLIP Text Encode (Prompt) 节点中:
- 在第一个编码器中编写详细的描述性提示
- 将第二个编码器留空或添加负面提示
- OmniGen2 在复杂的组合描述中表现出色
生成并保存
- 点击
Run
生成您的 OmniGen2 图像 - VAE Decode 将潜在变量转换为最终图像
- Save Image 自动将您的 OmniGen2 创作保存到输出文件夹
OmniGen2 图像编辑工作流
上传您的源图像
- 使用 Load Image 节点导入您想用 OmniGen2 编辑的图像

编写您的编辑指令
- 在 OmniGen2 的 CLIP Text Encode (Prompt) 节点中:
- 清晰具体地描述您想要的更改
- 示例:"将角色的发色变为自然的银白色","添加飞行员太阳镜"
- 自然语言命令与 OmniGen2 完美配合
配置 OmniGen2 编辑参数
- Scale Image to Total Pixels 节点:
- upscale_method:area(在调整大小时保持质量)
- megapixels:2.00(控制像素总数)
- 这会将您的图像调整到大约 200 万像素的总数
- 例如:会将 1920x1080 图像缩放以保持约 2MP
- 更高的值 = 更多细节但处理速度较慢
- 更低的值 = 生成速度较快但细节较少
- 2.00 是编辑能力的最佳选择
- VAE Encode 将您的缩放图像转换为潜在空间
可选:启用第二个图像输入
- 紫色(绕过)节点允许多图像操作:
- 按 Ctrl+B 切换绕过模式
- 上传第二张图像以进行风格转移或对象插入
- 非常适合 "合并图像 1 和图像 2 的元素" 之类的任务
生成编辑结果
- 执行 OmniGen2 工作流以查看应用的编辑
- 结果在保持高保真度的同时,精确遵循指令
致谢
此 ComfyUI 工作流整合了由北京人工智能研究院研究人员开发的开创性 OmniGen2 模型。特别感谢团队创建了这个推动 7B 参数模型可能性的统一多模态生成系统。该架构在平衡模型效率与生成质量方面代表了显著的进步。
更多关于 OmniGen2 的资源
OmniGen2 在开源许可下发布,使其可自由用于研究和商业应用。有关 OmniGen2 的更多信息:
- GitHub Repository - 官方实现和模型架构详情:
- Project Page - 综合概述,包含演示和技术见解:
- ComfyUI Examples - 分步教程和附加工作流:
想要更多 ComfyUI 工作流吗?
RunComfy 是首选的 ComfyUI 平台,提供 ComfyUI 在线 环境和服务,以及 ComfyUI 工作流 具有惊艳的视觉效果。 RunComfy还提供 AI Playground, 帮助艺术家利用最新的AI工具创作出令人惊叹的艺术作品。