Step1X-Edit | AI 圖像編輯工具
Step1X-Edit 是一個圖像編輯模型,處理參考圖像和用戶指令以創建精確編輯的輸出。此統一框架結合了多模態大型語言模型的強大語義推理與擴散架構,使您能夠執行 11 種不同的編輯操作,包括主題添加/移除、風格轉換、文本修改等。只需提供您的圖像並描述您想要的更改 - Step1X-Edit 提供與領先專有模型相當的工作室級結果。ComfyUI Step1X-Edit 工作流程
ComfyUI Step1X-Edit 範例
ComfyUI Step1X-Edit 說明
1. Step1X-Edit 是什麼?
Step1X-Edit 是由 StepFun AI 開發的高級圖像編輯模型,旨在提供與閉源模型如 GPT-4o 和 Gemini2 Flash 相當的性能。Step1X-Edit 框架結合了多媒體大型語言模型 (MLLM) 的語義推理能力與 Transformer 中的擴散 (DiT) 架構,以提供高質量的基於指令的圖像編輯。
Step1X-Edit 擅長理解自然語言指令並應用精確的編輯,同時保持圖像的真實性。Step1X-Edit 模型在超過 100 萬對高質量指令-圖像對上進行訓練,涵蓋 11 個不同的編輯類別,使其在各種編輯任務中表現得非常靈活。
2. ComfyUI Step1X-Edit 的優勢:
- 優秀的指令理解能力: Step1X-Edit 利用 MLLM 技術來理解複雜的編輯請求,對文本和視覺內容有細膩的理解。
- 全面的編輯能力: Step1X-Edit 處理 11 種不同的編輯類別,包括主題添加/移除、背景更改、顏色更改、材質修改、運動變更等。
- 高真實性結果: Step1X-Edit 在參考圖像重建和編輯提示遵循之間保持良好的平衡,保留圖像質量。
- 簡化的工作流程: 編輯過程中不需要遮罩,提供流暢的 Step1X-Edit 用戶體驗。
- 開源替代方案: Step1X-Edit 提供與專有模型相當的結果,同時完全開源。
3. 快速入門指南
3.1 系統要求
Step1X-Edit 是一個資源密集型模型,在以下條件下表現最佳:
- VRAM: 建議 80GB,以在 1024×1024 分辨率下獲得最佳性能
- 注意: RunComfy 的雲端 GPU 服務提供了 Step1X-Edit 所需的所有計算能力,無需任何安裝。只需從可用的選項中選擇一台擁有足夠 VRAM 的機器即可。
3.2 工作流程選項
Step1X-Edit 提供兩種主要的工作流程配置:
常規工作流程(非真人版本)
- 最佳用途: 用於一般物體、場景和非人類主題的編輯
- 特點:
- 簡單的三步驟過程:加載圖像 → 使用 Step1X-Edit 編輯 → 保存結果
- 在文本修改、主題添加/移除、風格轉換、背景更改等方面表現出色
- 直接編輯,無需額外的人臉處理
真人工作流程(擴展版本)
- 最佳用途: 編輯包含人臉的圖像,其中面部身份保留至關重要
- 特點:
- 結合 Step1X-Edit 與額外的人臉一致性保留
- 使用人臉邊界框和簡單的人物描述來增強身份保留
- 比標準的 Step1X-Edit 工作流程更好地保留身份特徵
3.3 參數參考
主要 Step1X-Edit 節點參數:
cfg
: 指導比例,通常約為 6.0(更高 = 更遵循提示)size_level
: 控制輸出分辨率(512, 768 或 1024)num_steps
: 擴散步數(通常為 20-31)mllm_model
: 視覺語言模型(默認:Qwen2.5-VL-7B-Instruct)
用於真人工作流程的附加參數:
- 人臉邊界框節點(來自 FaceAnalysis):
Index
: 人臉檢測控制-1
: 檢測所有人臉(默認)0
: 僅選擇最大的人臉1
: 選擇第二大的人臉- 在處理多個人臉時仔細檢查工作流程
padding
: 人臉周圍的額外空間(默認:0)padding_percent
: 基於百分比的填充(默認:0.30)

3.4 編輯任務類別
Step1X-Edit 已專門針對以下 11 個編輯類別進行優化:
- 主題添加:使用 Step1X-Edit 向場景中添加新物體或人物
- 主題移除:使用 Step1X-Edit 從圖像中移除不需要的元素
- 主題替換:使用 Step1X-Edit 將一個物體換成另一個
- 背景更改:在保留前景元素的同時修改或替換背景
- 顏色更改:使用 Step1X-Edit 更改圖像中的特定顏色
- 材質修改:改變物體的材質屬性(例如,玻璃變成金屬)
- 運動變更:使用 Step1X-Edit 改變主題的位置或姿勢
- 肖像美化:通過自然的改進增強或修改肖像
- 風格轉換:使用 Step1X-Edit 將藝術風格應用於圖像
- 文本修改:使用 Step1X-Edit 編輯或替換圖像中的文本
- 色調轉換:調整整體圖像的色調、光線或氛圍
3.5 分步使用指南
常規工作流程(非真人版本)
- 上傳您的圖像 使用加載圖像節點
- 在 Step1X-Edit 節點中輸入您的編輯指令
- 如有需要,調整參數:
cfg
: 6.0 是 Step1X-Edit 的良好默認值size_level
: 測試用 512,最終結果用 1024num_steps
: 20-31(步數越多,質量越好但速度越慢)
- 點擊運行 使用 Step1X-Edit 處理您的編輯
真人工作流程(人臉編輯)
- 上傳您的圖像 使用加載圖像節點
- 在 CR Prompt Text 節點中輸入簡單的人物描述
- 只需使用基本術語如"年輕女子"或"男子"
- 這有助於 Step1X-Edit 模型理解圖像中的人物
- 在 Step1X-Edit 節點中輸入您的編輯指令
- 具體說明您想改變的人的特徵
- 如有需要,調整參數:
- 與常規工作流程相同,外加人臉檢測設定如有需要
- 點擊運行 使用 Step1X-Edit 處理您的編輯
- 查看並下載 結果


3.6 獲得最佳結果的技巧
- 清晰的指令: 在您的 Step1X-Edit 提示中做到具體和簡明
- 尺寸考量: 較大的尺寸(1024)產生更好的質量但處理時間較長
- 人臉處理: 在編輯人臉時使用真人工作流程
- 多次編輯: 對於複雜的編輯,考慮將它們分解成單獨的步驟
- 工作流程選擇: 根據您的主題選擇合適的 Step1X-Edit 工作流程
- 機器選擇: 選擇 2X Large(80GB VRAM)或 2XL Plus(80GB VRAM)以獲得最佳的 Step1X-Edit 性能
4. 致謝
此實現基於 StepFun AI 團隊開發的 Step1X-Edit 模型()。ComfyUI 的 Step1X-Edit 集成由 創建,使這項強大的技術在 ComfyUI 環境中變得可訪問。
RunComfy 已將 Step1X-Edit 技術集成到易於使用的雲端工作流程中,無需本地安裝或高端硬件即可訪問高級 AI 圖像編輯。
誠摯感謝原作者和 ComfyUI 集成開發者,讓這個工具得以提供給社群。