Step1X-Edit | AI 图像编辑工具
Step1X-Edit 是一个图像编辑模型,能够处理参考图像和用户指令以创建精确编辑的输出。该统一框架结合了多模态大语言模型的强大语义推理能力与扩散架构,使您能够执行 11 种不同的编辑操作,包括主题添加/移除、风格迁移、文本修改等。只需提供您的图像并描述您想要的更改 - Step1X-Edit 提供的结果可与领先的专有模型媲美。ComfyUI Step1X-Edit 工作流程
ComfyUI Step1X-Edit 示例
ComfyUI Step1X-Edit 描述
1. 什么是 Step1X-Edit?
Step1X-Edit 是由 StepFun AI 开发的高级图像编辑模型,旨在提供与封闭源模型如 GPT-4o 和 Gemini2 Flash 相当的性能。Step1X-Edit 框架结合了多媒体大语言模型 (MLLM) 的语义推理能力与变换器中的扩散 (DiT) 架构,提供高质量的基于指令的图像编辑。
Step1X-Edit 擅长理解自然语言指令并应用精确编辑,同时保持图像的完整性。Step1X-Edit 模型在超过 100 万对高质量指令-图像对上进行了训练,涵盖 11 个不同的编辑类别,使其在各种编辑任务中具有非凡的灵活性。
2. ComfyUI Step1X-Edit 的优点:
- 卓越的指令理解能力: Step1X-Edit 利用 MLLM 技术理解复杂的编辑请求,具有对文本和视觉内容的细致理解。
- 全面的编辑能力: Step1X-Edit 处理 11 种不同的编辑类别,包括主题添加/移除、背景更改、颜色更改、材料修改、运动更改等。
- 高保真结果: Step1X-Edit 在参考图像重建和编辑提示遵循之间保持良好平衡,保留图像质量。
- 简化的工作流程: 编辑过程中无需使用蒙版,提供简化的 Step1X-Edit 用户体验。
- 开源替代方案: Step1X-Edit 提供与专有模型相当的结果,同时完全开源。
3. 快速入门指南
3.1 系统要求
Step1X-Edit 是一个资源密集型模型,在以下情况下表现最佳:
- VRAM: 推荐 80GB 以在 1024×1024 分辨率下获得最佳性能
- 注: RunComfy 的云 GPU 服务提供 Step1X-Edit 所需的所有计算能力,无需任何安装。只需从可用选项中选择具有足够 VRAM 的机器。
3.2 工作流选项
Step1X-Edit 提供两种主要的工作流配置:
常规工作流(非真人版本)
- 最佳用途: 使用 Step1X-Edit 进行对象、场景和非人类对象的一般编辑
- 特点:
- 简单的三步过程:加载图像 → 使用 Step1X-Edit 编辑 → 保存结果
- 在文本修改、主题添加/移除、风格迁移、背景更改等方面表现出色
- 直接编辑,无需额外的人脸处理
真人工作流(扩展版本)
- 最佳用途: 编辑包含人脸的图像,在面部身份保留方面至关重要
- 特点:
- 将 Step1X-Edit 与额外的人脸一致性保留结合使用
- 使用面部边界框和简单的人物描述来增强身份保留
- 比标准 Step1X-Edit 工作流更好地保留身份特征
3.3 参数参考
主要 Step1X-Edit 节点参数:
cfg
: 指导尺度,通常约为 6.0(更高 = 更符合提示)size_level
: 控制输出分辨率(512、768 或 1024)num_steps
: 扩散步骤数量(通常为 20-31)mllm_model
: 视觉语言模型(默认:Qwen2.5-VL-7B-Instruct)
对于真人工作流的附加参数:
- 面部边界框节点(来自 FaceAnalysis):
Index
: 人脸检测控制-1
: 检测所有人脸(默认)0
: 仅选择最大的人脸1
: 选择第二大的人脸- 处理多张人脸时请仔细检查工作流
padding
: 人脸周围的额外空间(默认:0)padding_percent
: 基于百分比的填充(默认:0.30)

3.4 编辑任务类别
Step1X-Edit 已针对以下 11 个编辑类别进行了专门优化:
- 主题添加:使用 Step1X-Edit 向场景中添加新对象或人物
- 主题移除:使用 Step1X-Edit 从图像中移除不需要的元素
- 主题替换:使用 Step1X-Edit 将一个对象替换为另一个对象
- 背景更改:在保留前景元素的同时修改或替换背景
- 颜色更改:使用 Step1X-Edit 更改图像中的特定颜色
- 材料修改:转换对象的材料属性(例如,玻璃变为金属)
- 运动更改:使用 Step1X-Edit 改变主体的位置或姿势
- 肖像美化:通过自然的改进来增强或修改肖像
- 风格迁移:使用 Step1X-Edit 将艺术风格应用于图像
- 文本修改:使用 Step1X-Edit 编辑或替换图像中的文本
- 色调转换:调整整体图像的色调、光照或氛围
3.5 分步使用指南
常规工作流(非真人版本)
- 使用加载图像节点上传您的图像
- 在 Step1X-Edit 节点中输入您的编辑指令
- 如有需要,调整参数:
cfg
: 6.0 是 Step1X-Edit 的一个良好默认值size_level
: 512 用于测试,1024 用于最终结果num_steps
: 20-31(更多步骤 = 更好质量但更慢)
- 点击运行以使用 Step1X-Edit 处理您的编辑
真人工作流(面部编辑)
- 使用加载图像节点上传您的图像
- 在 CR 提示文本节点中输入简单的人物描述
- 仅使用基本术语,如"年轻女性"或"男人"
- 这有助于 Step1X-Edit 模型了解图像中的人物
- 在 Step1X-Edit 节点中输入您的编辑指令
- 具体说明您希望更改人物的哪些内容
- 如有需要,调整参数:
- 与常规工作流相同,另外还有人脸检测设置
- 点击运行以使用 Step1X-Edit 处理您的编辑
- 查看并下载结果


3.6 最佳效果提示
- 清晰的指令: 在 Step1X-Edit 提示中保持具体和简洁
- 尺寸考虑: 较大尺寸 (1024) 产生更好质量,但处理时间更长
- 面部处理: 在使用 Step1X-Edit 编辑人脸时使用真人工作流
- 多次编辑: 对于复杂的编辑,考虑将它们分解为单独的步骤
- 工作流选择: 根据您的主题选择合适的 Step1X-Edit 工作流
- 机器选择: 选择 2X Large (80GB VRAM) 或 2XL Plus (80GB VRAM) 以获得最佳 Step1X-Edit 性能
4. 致谢
此实现基于 StepFun AI 团队开发的 Step1X-Edit 模型()。Step1X-Edit 的 ComfyUI 集成由 创建,使这种强大的技术在 ComfyUI 环境中可用。
RunComfy 将 Step1X-Edit 技术集成到一个易于使用的云工作流中,使高级 AI 图像编辑无需本地安装或高端硬件即可访问。
感谢原作者和 ComfyUI 集成开发者让这一工具对社区开放。