logo
RunComfy
  • ComfyUI
  • 训练器新
  • 模型
  • API
  • 定价
discord logo
模型
探索
所有模型
资源库
生成记录
模型 API
API 文档
API 密钥
账户
使用情况

GPT Image 2 图像编辑:在 Playground 和 API 上进行高保真图像到图像编辑 | Models and API | RunComfy

openai/gpt-image-2/edit

将源图像转换为精美的 4K 视觉效果,具有多语言文本、精确的绘画和品牌就绪编辑,以实现快速产品更新、营销活动和创意设计工作流程。

Image 1
要编辑的参考图像,最多 10 张图像
编辑图像的长宽比。如果省略,则从输入图像中自动检测。
输出分辨率。
图像质量。
输出图像格式。
Idle
Price per image (quality × resolution): low $0.030 / $0.060 / $0.090, medium $0.060 / $0.120 / $0.180, high $0.220 / $0.440 / $0.660 for 1K / 2K / 4K.

GPT Image 2 图像编辑简介

RunComfy 上的 OpenAI 的 GPT Image 2 将参考图像和指令转化为可立即投入生产的视觉效果,每张图像价格为 0.1 美元,输出高达 4K,并提供可靠的多语言文本渲染,可实现高保真图像到图像编辑。使用 GPT Image 2 Image Edit,将手动遮罩、重新拍摄和层重修饰改为上下文感知的内画、外画和精确排版,消除了复杂的遮罩并加快了电子商务团队、品牌设计师和营销工作流程的审批速度。对于开发人员来说,RunComfy 上的 GPT Image 2 Image Edit 既可以在浏览器中使用,也可以通过 HTTP API 使用,因此您无需自行托管或扩展模型。
非常适合:产品照片增强|活动视觉适应 |品牌资产本土化

OpenAI / GPT 图像 2 编辑#


在 RunComfy 上,GPT Image 2 提供最先进的图像生成功能以及 GPT Image 2 图像编辑功能,可使用一张或多张参考图像进行精确的、指令驱动的转换。它接受图像和文本提示,返回适合商业视觉效果、产品镜头、UI 模型和营销资产的高保真静态图像。


亮点#

  • 遵循指令的编辑:使用自然语言修改参考图像,并可靠地遵循复杂的方向。
  • 高文本易读性:通常比早期的 GPT 图像模型更准确地呈现标签、UI 文本和多语言排版。
  • 灵活的输入处理:可通过 GPT Image 2 Image Edit 处理多达 10 个输入图像,以进行批量更新或多角度参考。
  • 连贯的构图:改进照明、反射和场景结构,在迭代中获得更一致、逼真的结果。
  • 针对工作流程优化的分辨率和宽高比预设:选择分辨率等级(1K、2K、4K)和宽高比(1:1、3:2、2:3、3:4、4:3、4:5、5:4、9:16、16:9、21:9)以平衡细节和速度。
  • 强大的编辑保真度:GPT Image 2 Image Edit 在应用引导更改时通常会保持标识、品牌元素和布局。

参数#


参数必填类型默认范围/选项描述
图像*是 (*)图像列表—1 至 10 张图片要编辑的参考图像,最多 10 张图像
prompt*是(*)string——所需编辑的文字描述
分辨率没有枚举(字符串)1K1K、2K、4K生成图像的输出分辨率层
纵横比没有枚举(字符串)1:11:1、3:2、2:3、3:4、4:3、4:5、5:4、9:16、16:9、21:9生成图像的长宽比

相关模型

flux-2-klein/4b/text-to-image

4 步亚秒级文本到图像,具有即时准确的视觉效果

ideogram-v3/edit

使用Ideogram 3.0轻松进行图像到图像编辑,自由修改构图与风格,助力创意设计实现。

flux-1-kontext/pro/text-to-image

智能文本生成图像模型,精准高效,助力设计师灵感创作与细节优化。

gpt-4o-image/text-to-image

快速将文字创意转化为高质量、细节丰富的逼真图像,轻松实现视觉灵感。

imagen-4/fast/text-to-image

使用Google Imagen 4 Fast,将文本瞬间变成高质量逼真图像,创意设计更高效。

ideogram-v3/reframe

使用Ideogram 3.0轻松实现图像重构、风格再现与背景替换,助力设计师高效创意表达。

常见问题

使用 GPT Image 2 Image Edit 进行图像到图像工作流程时,最大分辨率和宽高比限制是多少?

GPT Image 2 图像编辑支持高达约 4K 的输出分辨率,遵守基础模型定义的像素预算限制。对于图像到图像的编辑,最好保持与输入图像相似的纵横比,以确保保真度。超过这些参数可能会导致自动调整大小或降低视觉一致性。

执行高保真图像到图像更新时,GPT Image 2 Image Edit 中是否有任何提示或输入限制?

是的。 GPT Image 2 图像编辑通常将文本提示限制为几千个标记,并且可能将参考输入限制为一个主图像以执行图像到图像任务。高级多参考控制(例如 ControlNet 或 IP 适配器)可能会在更高版本的 API 中提供,但当前的实现优先考虑单图像引导。

如何将我的 GPT Image 2 Image Edit 图像到图像原型从 RunComfy 模型界面 迁移到基于 API 的生产工作流程?

要从试用转向生产,请从 RunComfy 模型界面 导出 GPT Image 2 图像编辑配置,用 RunComfy API 端点替换手动编辑步骤,并使用生产 API 密钥进行身份验证。确保您管理 API 速率限制和美元余额,因为生产请求会消耗付费计算资源,而 Playground 试用版使用有限的免费配额。

在图像间一致性方面,GPT Image 2 Image Edit 与 GPT Image 1.5 等早期模型有何区别?

与 GPT Image 1.5 相比,GPT Image 2 图像编辑可提供卓越的视觉稳定性和指令遵循性。在图像到图像操作中,由于新的自回归多模态架构取代了先前的基于扩散的系统,它更有效地保留了角色相似性、照明准确性和场景连贯性。

GPT Image 2 Image Edit 在图像到图像用例中渲染文本和多语言内容的效果如何?

GPT Image 2 Image Edit 擅长再现准确的文本叠加,包括非拉丁和多语言脚本。这代表了较旧模型的显着进步,因为即使在同一会话中进行多次图像到图像编辑后,它也可以最大限度地减少失真并保持文本的易读性。

GPT Image 2 Image Edit 能否比 Nano Banana Pro 等竞争对手更好地处理逼真的产品图像?

GPT Image 2 图像编辑为照片级真实感和构图任务提供出色的保真度,特别是在精确的文本渲染或产品标签至关重要的情况下。虽然 Nano Banana Pro 在某些测试中生成速度可能会稍快一些,并且具有更平滑的皮肤纹理真实感,但 GPT Image 2 图像编辑为商业级图像到图像工作流程提供了更强的控制和场景准确性。

GPT Image 2 Image Edit 如何在图像到图像会话的迭代细化过程中保持视觉连贯性?

GPT Image 2 Image Edit 使用自回归设计,可跟踪多代之间的上下文连贯性。因此,与可能在编辑过程中漂移的扩散模型相比,在执行迭代图像到图像细化时,它可以更好地保留几何结构、反射和照明一致性。

运行 GPT Image 2 Image Edit 进行大规模图像到图像生产批次时,是否有任何延迟注意事项或性能提示?

对于基于批处理的使用,GPT Image 2 Image Edit 可能会比轻量级生成器产生稍高的延迟。开发人员应管理请求并发性并考虑较小的图像到图像批量大小以提高效率。缓存可重用的引用并最大程度地减少冗余上传也可以提高生产吞吐量。

哪些类型的创意任务最能从 GPT Image 2 Image Edit 的图像到图像模式中受益?

GPT Image 2 图像编辑在专业产品视觉效果、UX/UI 模型和品牌更新方面表现出色,在这些方面忠实保存构图至关重要。其图像到图像编辑模式可让用户干净地转换现有图像、优化对象放置或修改颜色和文本叠加,同时保持视觉保真度。

关注我们
  • 领英
  • Facebook
  • Instagram
  • Twitter
支持
  • Discord
  • 电子邮件
  • 系统状态
  • 附属
视频模型
  • Wan 2.6 Flash
  • Wan 2.7 Reference to Video
  • Seedance 1.0
  • Seedance 1.0 Pro Fast
  • Seedance 2.0 Pro
  • Hailuo 2.3 Fast Standard
  • 查看所有模型 →
图像模型
  • Ideogram V4
  • Wan 2.6 Image to Image
  • Nano Banana 2 Edit
  • Flux 2 Dev
  • Nano Banana Pro
  • Qwen Image Edit 2511 LoRA
  • 查看所有模型 →
法律
  • 服务条款
  • 隐私政策
  • Cookie 政策
RunComfy
版权 2026 RunComfy. 保留所有权利。

RunComfy 是首选的 ComfyUI 平台,提供 ComfyUI 在线 环境和服务,以及 ComfyUI 工作流 具有惊艳的视觉效果。 RunComfy还提供 AI Models, 帮助艺术家利用最新的AI工具创作出令人惊叹的艺术作品。

GPT Image 2 图像编辑示例