OmniGen2 ComfyUI 工作流将统一的多模态生成带到您的指尖,将文本到图像合成和基于指令的图像编辑结合在一个强大的框架中。可以将其视为一个创意 AI 助手,不仅可以从您的文本描述中生成惊人的图像,还能以惊人的精确度理解和执行复杂的编辑命令。
该工作流利用了一个复杂的 7B 参数模型,建立在 Qwen 2.5 VL 基础之上,具有独特的双路径 Transformer 架构。这个模型的特别之处在于其解耦设计 - 使用独立的路径进行文本和图像生成,使其在保持卓越语言理解的同时,提供高保真视觉输出,忠实于您的创意愿景。
双生成模式:OmniGen2 通过直观的界面,使用自然语言命令从文本创建新图像或编辑现有图像。
先进的架构:OmniGen2 的双路径设计将文本和图像处理分开,以实现最佳性能。
组合理解:OmniGen2 以卓越的准确性处理复杂的多元素提示。
精确的图像编辑:使用 OmniGen2 的高级算法进行有针对性的更改,同时完美保留图像的其他部分。
多模态反思:OmniGen2 自我分析和优化输出以提高结果。
设置图像尺寸
制作您的文本提示
生成并保存
Run
生成您的 OmniGen2 图像上传您的源图像
编写您的编辑指令
配置 OmniGen2 编辑参数
可选:启用第二个图像输入
生成编辑结果
此 ComfyUI 工作流整合了由北京人工智能研究院研究人员开发的开创性 OmniGen2 模型。特别感谢团队创建了这个推动 7B 参数模型可能性的统一多模态生成系统。该架构在平衡模型效率与生成质量方面代表了显著的进步。
OmniGen2 在开源许可下发布,使其可自由用于研究和商业应用。有关 OmniGen2 的更多信息:
RunComfy 是首选的 ComfyUI 平台,提供 ComfyUI 在线 环境和服务,以及 ComfyUI 工作流 具有惊艳的视觉效果。 RunComfy还提供 AI Playground, 帮助艺术家利用最新的AI工具创作出令人惊叹的艺术作品。