GPT Image 2 影像編輯：在 Playground 和 API 上進行高保真影像到影像編輯 | Models and API

openai/gpt-image-2/edit

將來源圖像轉換為精美的 4K 視覺效果，具有多語言文字、精確的繪畫和品牌就緒編輯，以實現快速產品更新、行銷活動和創意設計工作流程。

Idle

Price per image (quality × resolution): low $0.030 / $0.060 / $0.090, medium $0.060 / $0.120 / $0.180, high $0.220 / $0.440 / $0.660 for 1K / 2K / 4K.

GPT Image 2 影像編輯簡介

RunComfy 上的 OpenAI 的 GPT Image 2 將參考圖像和指令轉化為可立即投入生產的視覺效果，每張圖像價格為 0.1 美元，輸出高達 4K，並提供可靠的多語言文本渲染，可實現高保真圖像到圖像編輯。使用 GPT Image 2 Image Edit，將手動遮罩、重新拍攝和層重修飾改為上下文感知的內畫、外畫和精確排版，消除了複雜的遮罩並加快了電子商務團隊、品牌設計師和營銷工作流程的審批速度。對於開發人員來說，RunComfy 上的 GPT Image 2 Image Edit 既可以在瀏覽器中使用，也可以透過 HTTP API 使用，因此您無需自行託管或擴展算力與併發。
非常適合：產品照片增強|活動視覺適應 |品牌資產本土化

OpenAI / GPT 影像 2 編輯#

在 RunComfy 上，GPT Image 2 提供最先進的影像產生功能以及 GPT Image 2 影像編輯功能，可使用一張或多張參考影像進行精確的、指令驅動的轉換。它接受圖像和文字提示，傳回適合商業視覺效果、產品鏡頭、UI 模型和行銷資產的高保真靜態圖像。

亮點#

遵循指令的編輯：使用自然語言修改參考影像，並可靠地遵循複雜的方向。
高文字易讀性：通常比早期的 GPT 圖像模型更準確地呈現標籤、UI 文字和多語言排版。
靈活的輸入處理：可透過 GPT Image 2 Image Edit 處理多達 10 個輸入影像，以進行批次更新或多角度參考。
連貫的構圖：改善照明、反射和場景結構，在迭代中獲得更一致、逼真的結果。
針對工作流程最佳化的解析度和寬高比預設：選擇解析度等級（1K、2K、4K）和寬高比（1:1、3:2、2:3、3:4、4:3、4:5、5:4、9:16、16:9、21:9）以平衡細節和速度。
強大的編輯保真度：GPT Image 2 Image Edit 在應用引導變更時通常會保持標識、品牌元素和佈局。

參數#

參數	必填	類型	預設	範圍/選項	說明
圖像*	是 (*)	圖像列表	—	1 至 10 張圖片	要編輯的參考圖像，最多 10 張圖像
提示*	是 (*)	字串	—	—	所需編輯的文字描述
解析度	沒有	枚舉（字串）	1K	1K、2K、4K	產生影像的輸出解析度層
縱橫比	沒有	枚舉（字串）	1:1	1:1、3:2、2:3、3:4、4:3、4:5、5:4、9:16、16:9、21:9	產生影像的長寬比

常見問題

使用 GPT Image 2 Image Edit 進行影像到影像工作流程時，最大解析度和寬高比限制是多少？

GPT Image 2 影像編輯支援高達約 4K 的輸出分辨率，遵守基礎模型定義的像素預算限制。對於影像到影像的編輯，最好保持與輸入影像相似的縱橫比，以確保保真度。超過這些參數可能會導致自動調整大小或降低視覺一致性。

執行高保真影像到影像更新時，GPT Image 2 Image Edit 中是否有任何提示或輸入限制？

是的。 GPT Image 2 影像編輯通常將文字提示限制為數千個標記，並且可能將參考輸入限制為一個主影像以執行影像到影像任務。進階多參考控制（例如 ControlNet 或 IP 適配器）可能會在更高版本的 API 中提供，但目前的實作優先考慮單一影像引導。

如何將我在 RunComfy 模型介面中的 GPT Image 2 Image Edit 圖生圖原型，遷移到以 API 為主的正式工作流程？

若要從試用轉向生產，請從 RunComfy 模型介面匯出 GPT Image 2 影像編輯配置，以 RunComfy API 端點取代手動編輯步驟，並使用生產 API 金鑰進行驗證。確保您管理 API 速率限制和美元餘額，因為生產請求會消耗付費運算資源，而 Playground 試用版使用有限的免費配額。

在影像間一致性方面，GPT Image 2 Image Edit 與 GPT Image 1.5 等早期模型有何不同？

與 GPT Image 1.5 相比，GPT Image 2 影像編輯可提供卓越的視覺穩定性和指令遵循。在影像到影像操作中，由於新的自回歸多模態架構取代了先前的基於擴散的系統，它更有效地保留了角色相似性、照明準確性和場景連貫性。

GPT Image 2 Image Edit 在圖像到圖像用例中渲染文字和多語言內容的效果如何？

GPT Image 2 Image Edit 擅長再現準確的文本疊加，包括非拉丁和多語言腳本。這代表了較舊模型的顯著進步，因為即使在同一會話中進行多次圖像到圖像編輯後，它也可以最大限度地減少失真並保持文字的易讀性。

GPT Image 2 Image Edit 能否比 Nano Banana Pro 等競爭對手更能處理逼真的產品影像？

GPT Image 2 影像編輯為照片級真實感和構圖任務提供出色的保真度，特別是在精確的文字渲染或產品標籤至關重要的情況下。雖然 Nano Banana Pro 在某些測試中生成速度可能會稍快一些，並且具有更平滑的皮膚紋理真實感，但 GPT Image 2 影像編輯為商業級影像到影像工作流程提供了更強的控制和場景準確性。

GPT Image 2 Image Edit 如何在影像到影像會話的迭代細化過程中保持視覺連貫性？

GPT Image 2 Image Edit 使用自回歸設計，可追蹤多代之間的上下文連貫性。因此，與可能在編輯過程中漂移的擴散模型相比，在執行迭代影像到影像細化時，它可以更好地保留幾何結構、反射和照明一致性。

執行 GPT Image 2 Image Edit 進行大規模影像到影像生產批次時，是否有任何延遲注意事項或效能提示？

對於基於批次的使用，GPT Image 2 Image Edit 可能會比輕量級產生器產生稍高的延遲。開發人員應管理請求並發性並考慮較小的影像到影像批次大小以提高效率。快取可重複使用的引用並最大程度地減少冗餘上傳也可以提高生產吞吐量。

哪些類型的創意任務最能從 GPT Image 2 Image Edit 的影像到影像模式中受益？

GPT Image 2 影像編輯在專業產品視覺效果、UX/UI 模型和品牌更新方面表現出色，在這些方面忠實保存構圖至關重要。其圖像到圖像編輯模式可讓使用者乾淨地轉換現有圖像、優化物件放置或修改顏色和文字疊加，同時保持視覺保真度。

RunComfy

RunComfy 是首選的 ComfyUI 平台，提供 ComfyUI 在線環境和服務，以及 ComfyUI 工作流程具有驚豔的視覺效果。 RunComfy還提供 AI Models, 幫助藝術家利用最新的AI工具創作出令人驚艷的藝術作品。

OpenAI / GPT 影像 2 編輯#

亮點#

遵循指令的編輯：使用自然語言修改參考影像，並可靠地遵循複雜的方向。

高文字易讀性：通常比早期的 GPT 圖像模型更準確地呈現標籤、UI 文字和多語言排版。

靈活的輸入處理：可透過 GPT Image 2 Image Edit 處理多達 10 個輸入影像，以進行批次更新或多角度參考。

連貫的構圖：改善照明、反射和場景結構，在迭代中獲得更一致、逼真的結果。

針對工作流程最佳化的解析度和寬高比預設：選擇解析度等級（1K、2K、4K）和寬高比（1:1、3:2、2:3、3:4、4:3、4:5、5:4、9:16、16:9、21:9）以平衡細節和速度。

強大的編輯保真度：GPT Image 2 Image Edit 在應用引導變更時通常會保持標識、品牌元素和佈局。

參數#

參數

必填

類型

預設

範圍/選項

說明

圖像*

是 (*)

圖像列表

—

1 至 10 張圖片

要編輯的參考圖像，最多 10 張圖像

提示*

是 (*)

字串

—

所需編輯的文字描述

解析度

沒有

枚舉（字串）

1K、2K、4K

產生影像的輸出解析度層

縱橫比

沒有

枚舉（字串）

1:1

1:1、3:2、2:3、3:4、4:3、4:5、5:4、9:16、16:9、21:9

產生影像的長寬比

常見問題

將來源圖像轉換為精美的 4K 視覺效果，具有多語言文字、精確的繪畫和品牌就緒編輯，以實現快速產品更新、行銷活動和創意設計工作流程。

GPT Image 2 影像編輯簡介

OpenAI / GPT 影像 2 編輯#

亮點#

參數#

相關模型

常見問題

使用 GPT Image 2 Image Edit 進行影像到影像工作流程時，最大解析度和寬高比限制是多少？

執行高保真影像到影像更新時，GPT Image 2 Image Edit 中是否有任何提示或輸入限制？

如何將我在 RunComfy 模型介面中的 GPT Image 2 Image Edit 圖生圖原型，遷移到以 API 為主的正式工作流程？

在影像間一致性方面，GPT Image 2 Image Edit 與 GPT Image 1.5 等早期模型有何不同？

GPT Image 2 Image Edit 在圖像到圖像用例中渲染文字和多語言內容的效果如何？

GPT Image 2 Image Edit 能否比 Nano Banana Pro 等競爭對手更能處理逼真的產品影像？

GPT Image 2 Image Edit 如何在影像到影像會話的迭代細化過程中保持視覺連貫性？

執行 GPT Image 2 Image Edit 進行大規模影像到影像生產批次時，是否有任何延遲注意事項或效能提示？

哪些類型的創意任務最能從 GPT Image 2 Image Edit 的影像到影像模式中受益？

將來源圖像轉換為精美的 4K 視覺效果，具有多語言文字、精確的繪畫和品牌就緒編輯，以實現快速產品更新、行銷活動和創意設計工作流程。

GPT Image 2 影像編輯簡介

GPT Image 2 影像編輯範例

OpenAI / GPT 影像 2 編輯#

亮點#

參數#

相關模型

常見問題

使用 GPT Image 2 Image Edit 進行影像到影像工作流程時，最大解析度和寬高比限制是多少？

執行高保真影像到影像更新時，GPT Image 2 Image Edit 中是否有任何提示或輸入限制？

如何將我在 RunComfy 模型介面中的 GPT Image 2 Image Edit 圖生圖原型，遷移到以 API 為主的正式工作流程？

在影像間一致性方面，GPT Image 2 Image Edit 與 GPT Image 1.5 等早期模型有何不同？

GPT Image 2 Image Edit 在圖像到圖像用例中渲染文字和多語言內容的效果如何？

GPT Image 2 Image Edit 能否比 Nano Banana Pro 等競爭對手更能處理逼真的產品影像？

GPT Image 2 Image Edit 如何在影像到影像會話的迭代細化過程中保持視覺連貫性？

執行 GPT Image 2 Image Edit 進行大規模影像到影像生產批次時，是否有任何延遲注意事項或效能提示？

哪些類型的創意任務最能從 GPT Image 2 Image Edit 的影像到影像模式中受益？

GPT Image 2 影像編輯範例

GPT Image 2 影像編輯：在 Playground 和 API 上進行高保真影像到影像編輯 | Models and API | RunComfy

將來源圖像轉換為精美的 4K 視覺效果，具有多語言文字、精確的繪畫和品牌就緒編輯，以實現快速產品更新、行銷活動和創意設計工作流程。

GPT Image 2 影像編輯簡介

OpenAI / GPT 影像 2 編輯#

亮點#

參數#

相關模型

常見問題

使用 GPT Image 2 Image Edit 進行影像到影像工作流程時，最大解析度和寬高比限制是多少？

執行高保真影像到影像更新時，GPT Image 2 Image Edit 中是否有任何提示或輸入限制？

如何將我在 RunComfy 模型介面中的 GPT Image 2 Image Edit 圖生圖原型，遷移到以 API 為主的正式工作流程？

在影像間一致性方面，GPT Image 2 Image Edit 與 GPT Image 1.5 等早期模型有何不同？

GPT Image 2 Image Edit 在圖像到圖像用例中渲染文字和多語言內容的效果如何？

GPT Image 2 Image Edit 能否比 Nano Banana Pro 等競爭對手更能處理逼真的產品影像？

GPT Image 2 Image Edit 如何在影像到影像會話的迭代細化過程中保持視覺連貫性？

執行 GPT Image 2 Image Edit 進行大規模影像到影像生產批次時，是否有任何延遲注意事項或效能提示？

哪些類型的創意任務最能從 GPT Image 2 Image Edit 的影像到影像模式中受益？

GPT Image 2 影像編輯：在 Playground 和 API 上進行高保真影像到影像編輯 | Models and API | RunComfy

將來源圖像轉換為精美的 4K 視覺效果，具有多語言文字、精確的繪畫和品牌就緒編輯，以實現快速產品更新、行銷活動和創意設計工作流程。

GPT Image 2 影像編輯簡介

GPT Image 2 影像編輯範例

OpenAI / GPT 影像 2 編輯#

亮點#

參數#

相關模型

常見問題

使用 GPT Image 2 Image Edit 進行影像到影像工作流程時，最大解析度和寬高比限制是多少？

執行高保真影像到影像更新時，GPT Image 2 Image Edit 中是否有任何提示或輸入限制？

如何將我在 RunComfy 模型介面中的 GPT Image 2 Image Edit 圖生圖原型，遷移到以 API 為主的正式工作流程？

在影像間一致性方面，GPT Image 2 Image Edit 與 GPT Image 1.5 等早期模型有何不同？

GPT Image 2 Image Edit 在圖像到圖像用例中渲染文字和多語言內容的效果如何？

GPT Image 2 Image Edit 能否比 Nano Banana Pro 等競爭對手更能處理逼真的產品影像？

GPT Image 2 Image Edit 如何在影像到影像會話的迭代細化過程中保持視覺連貫性？

執行 GPT Image 2 Image Edit 進行大規模影像到影像生產批次時，是否有任何延遲注意事項或效能提示？

哪些類型的創意任務最能從 GPT Image 2 Image Edit 的影像到影像模式中受益？

GPT Image 2 影像編輯範例