OmniGen2 ComfyUI 工作流 | 统一的文本到图像生成

ComfyUI OmniGen2 工作流程

OmniGen2 ComfyUI Workflow | Unified Text-to-Image Generation

想要运行这个工作流吗？

完全可操作的工作流
没有缺失的节点或模型
无需手动设置
具有惊艳的视觉效果

ComfyUI OmniGen2 示例

omnigen2-comfyui-workflow-unified-text-to-image-generation-1247-example_01.webp

omnigen2-comfyui-workflow-unified-text-to-image-generation-1247-example_02.webp

omnigen2-comfyui-workflow-unified-text-to-image-generation-1247-example_03.webp

omnigen2-comfyui-workflow-unified-text-to-image-generation-1247-example_04.webp

什么是 OmniGen2 ComfyUI 工作流？#

OmniGen2 ComfyUI 工作流将统一的多模态生成带到您的指尖，将文本到图像合成和基于指令的图像编辑结合在一个强大的框架中。可以将其视为一个创意 AI 助手，不仅可以从您的文本描述中生成惊人的图像，还能以惊人的精确度理解和执行复杂的编辑命令。

该工作流利用了一个复杂的 7B 参数模型，建立在 Qwen 2.5 VL 基础之上，具有独特的双路径 Transformer 架构。这个模型的特别之处在于其解耦设计 - 使用独立的路径进行文本和图像生成，使其在保持卓越语言理解的同时，提供高保真视觉输出，忠实于您的创意愿景。

OmniGen2 的关键特性和优势#

双生成模式：OmniGen2 通过直观的界面，使用自然语言命令从文本创建新图像或编辑现有图像。

先进的架构：OmniGen2 的双路径设计将文本和图像处理分开，以实现最佳性能。

组合理解：OmniGen2 以卓越的准确性处理复杂的多元素提示。

精确的图像编辑：使用 OmniGen2 的高级算法进行有针对性的更改，同时完美保留图像的其他部分。

多模态反思：OmniGen2 自我分析和优化输出以提高结果。

如何在 ComfyUI 中使用 OmniGen2#

OmniGen2 文本到图像工作流#

设置图像尺寸

使用 EmptySD3LatentImage 节点定义 OmniGen2 的输出大小：
- 根据您的 OmniGen2 需求调整宽度和高度
- 将 batch_size 保持为 1 以生成单张图像

制作您的文本提示

在 OmniGen2 的 CLIP Text Encode (Prompt) 节点中：
- 在第一个编码器中编写详细的描述性提示
- 将第二个编码器留空或添加负面提示
- OmniGen2 在复杂的组合描述中表现出色

生成并保存

点击 Run 生成您的 OmniGen2 图像
VAE Decode 将潜在变量转换为最终图像
Save Image 自动将您的 OmniGen2 创作保存到输出文件夹

OmniGen2 图像编辑工作流#

上传您的源图像

使用 Load Image 节点导入您想用 OmniGen2 编辑的图像

编写您的编辑指令

在 OmniGen2 的 CLIP Text Encode (Prompt) 节点中：
- 清晰具体地描述您想要的更改
- 示例："将角色的发色变为自然的银白色"，"添加飞行员太阳镜"
- 自然语言命令与 OmniGen2 完美配合

配置 OmniGen2 编辑参数

Scale Image to Total Pixels 节点：
- upscale_method：area（在调整大小时保持质量）
- megapixels：2.00（控制像素总数）
  - 这会将您的图像调整到大约 200 万像素的总数
  - 例如：会将 1920x1080 图像缩放以保持约 2MP
  - 更高的值 = 更多细节但处理速度较慢
  - 更低的值 = 生成速度较快但细节较少
  - 2.00 是编辑能力的最佳选择 <img src="https://cdn.runcomfy.net/workflow_assets/1247/readme01.webp" alt="OmniGen2" width="650"/>
VAE Encode 将您的缩放图像转换为潜在空间

可选：启用第二个图像输入

紫色（绕过）节点允许多图像操作：
- 按 Ctrl+B 切换绕过模式
- 上传第二张图像以进行风格转移或对象插入
- 非常适合 "合并图像 1 和图像 2 的元素" 之类的任务 <img src="https://cdn.runcomfy.net/workflow_assets/1247/readme02.webp" alt="OmniGen2" width="650"/>

生成编辑结果

执行 OmniGen2 工作流以查看应用的编辑
结果在保持高保真度的同时，精确遵循指令

致谢#

此 ComfyUI 工作流整合了由北京人工智能研究院研究人员开发的开创性 OmniGen2 模型。特别感谢团队创建了这个推动 7B 参数模型可能性的统一多模态生成系统。该架构在平衡模型效率与生成质量方面代表了显著的进步。

Want More ComfyUI Workflows?

FLUX Kontext Dev | 智能图像编辑

Kontext Dev = 可控 + 所有图形设计需求于一体的工具

DreamO | 统一多任务图像定制框架

从 1–3 个参考中执行身份、风格、试穿和多条件图像生成

BAGEL AI | T2I + I2T + I2I

使用开源 AI 的多模态理解与生成。

Step1X-Edit | AI 图像编辑工具

在 Step1X-Edit 中使用自然语言执行 11 项编辑操作。

Cosmos-Predict2 | 文本到图像 & 视频到世界

快速且真实！NVIDIA Cosmos 拥有真实物理效果。

SteadyDancer | 逼真的图像到视频生成器

立即将肖像转变为流畅、逼真的运动视频。

ComfyUI中的LongCat头像 | 身份一致的头像动画

将一张图片转化为流畅、身份一致的头像动画。

Flux Kontext Zoom Out ComfyUI 工作流程 | 无缝Outpainting

Zoom Out LoRA 自然连续地无缝放大图像。

关注我们

支持

资源

法律

RunComfy

RunComfy 是首选的 ComfyUI 平台，提供 ComfyUI 在线环境和服务，以及 ComfyUI 工作流具有惊艳的视觉效果。 RunComfy还提供 AI Models, 帮助艺术家利用最新的AI工具创作出令人惊叹的艺术作品。

OmniGen2 | 文本到图像 & 编辑