JoyAI 图像编辑 ComfyUI:保留结构的指令引导图像编辑
此工作流在 ComfyUI 中直接为单个参考图像提供快速的指令引导编辑。基于 JoyAI-Image-Edit 堆栈构建,它执行提示驱动的更改,如对象和颜色交换、空间调整和文本清晰渲染,同时保持源构图完整。JoyAI 图像编辑 ComfyUI 适合需要控制编辑而无需手动遮罩的设计师、产品团队和创作者。
您提供一张图像和一个短指令,例如“将盘子变蓝。”工作流通过 JoyAI 图像编辑转换器、文本编码器和 VAE 路由该请求,然后返回编辑后的图像,尊重布局和内容边界。这是一个紧凑、模型特定的 ComfyUI 设置,专注于可预测的结果和可复现性。
ComfyUI JoyAI 图像编辑 ComfyUI 工作流中的关键模型
- JoyAI-Image-Edit transformer。核心编辑模型,以您的指令和参考图像为条件,产生保留结构的更改。模型卡:jdopensource/JoyAI-Image-Edit。
- JoyAI-Image-Edit 文本编码器和分词器。将编辑指令编码为转换器可以遵循的嵌入。实现和用法在 JoyAI Image 代码库中:jd-opensource/JoyAI-Image。
- VAE for JoyAI Image Edit。压缩和重建用于编辑和解码的图像,有助于颜色保真度和细节保留。工作流参考捆绑在 JoyAI 堆栈中的 Wan 2.1 VAE 检查点。
如何使用 ComfyUI JoyAI 图像编辑 ComfyUI 工作流
管道从左到右流动:加载源图像,编写指令,加载 JoyAI 堆栈,运行编辑,然后保存。典型编辑不需要遮罩,工作流设计用于可复现的结果。
- 准备源图像
- 使用
LoadImage(#6) 加载您的参考。使用干净、光线良好的图像以获得最佳效果,并保持主体合理居中。如果您想准确保持构图,请在更改画布大小之前裁剪源。工作流将此图像直接传递到编辑阶段,因此其结构锚定结果。
- 使用
- 编写编辑指令
- 在
Prompt(#4) 中输入您的请求,并可选择在Negative Prompt(#5) 中定义排除项。保持指令简短、具体且可操作,例如“将杯子变红”、“用日落替换天空”或“在笔记本上添加文本 JOYAI”。负面提示有助于避免不需要的颜色、对象或风格。JoyAI 图像编辑 ComfyUI 尊重指令,同时保持与原始布局的一致性。
- 在
- 加载 JoyAI 堆栈
- 模型组件由
JoyAIImageEditTransformerLoader(#1)、JoyAIImageEditTextEncoderLoader(#2) 和JoyAIImageEditVAELoader(#3) 加载。这些节点获取转换器权重、文本编码器加分词器以及管理图像编码和解码的 VAE。通常您不需要更改这些,除非您正在更换检查点以获得不同的外观或行为。保持这个三重奏一致确保了指令语义、几何和颜色空间的稳定。
- 模型组件由
- 运行编辑
JoyAIImageEditPipeline(#7) 将您的源图像与指令嵌入融合以生成编辑结果。管道平衡指令强度与结构保真度,以便对象保持在应有的位置,同时其属性根据请求变化。使用固定种子以实现可复现性,或切换种子以探索变体。如果您需要更清晰的字母或细边缘,请在保持图像尺寸合理相对于源的情况下提高采样器中的质量设置。
- 保存和审核
SaveImage(#8) 写入编辑后的输出。使用版本化名称来进行并排比较,并在文件名或笔记中保留种子,以便您可以重现喜欢的结果。在迭代时,一次只调整一个控制以查看清晰的因果关系。
ComfyUI JoyAI 图像编辑 ComfyUI 工作流中的关键节点
JoyAIImageEditPipeline(#7)- 中央协调者,使用 JoyAI transformer、文本编码器和 VAE 将指令应用到参考图像上。首先调整
prompt和negative_prompt。使用固定seed进行确定性重跑,然后改变它以探索替代方案。在指令强度和采样质量之间取得平衡,以便速度与保真度之间进行权衡,并保持输出尺寸接近源的纵横比以保留布局。
- 中央协调者,使用 JoyAI transformer、文本编码器和 VAE 将指令应用到参考图像上。首先调整
JoyAIImageEditTransformerLoader(#1)- 加载 JoyAI-Image-Edit 转换器检查点,确定编辑跟随文本的强度和清晰度。更换这个权重可以显著改变风格和响应能力。将转换器和文本编码器从同一发布系列配对,以避免嵌入不匹配。
JoyAIImageEditTextEncoderLoader(#2)- 提供将您的指令翻译为模型可读嵌入的文本编码器和分词器。清晰、简洁的措辞提高嵌入质量。精度设置可能会影响 VRAM 使用和速度,因此选择适合您的硬件和批处理大小的模式。
JoyAIImageEditVAELoader(#3)- 加载 VAE,管理图像在编辑周围的编码和解码。不同的 VAE 可以微妙地改变颜色和对比度,因此在评估提示时保持一致。如果您更改 VAE,请重新审视您的提示以重新平衡颜色措辞。
可选附加项
- 提示制作
- 优选单一、明确的动作,如“将盘子变蓝”而不是多步段落。准确命名可见对象,并在编辑属性时使用单数名词。对于空间编辑,请使用介词如“在桌子上”、“在背景中”或“在墙上”来定位请求。
- 分辨率和构图
- 保留源的纵横比以保持几何形状。如果需要更大的交付物,请在编辑后放大,而不是推动极端编辑分辨率。
- 可复现性
- 在比较提示变体时保持固定种子,然后在满意后解锁种子以采样替代选项。
- 参考和来源
- 模型卡和权重:jdopensource/JoyAI-Image-Edit
- 实现细节和更新:jd-opensource/JoyAI-Image
- 本项目使用的 ComfyUI 图形模板:joyai_image_comfyui
致谢
此工作流实现并构建在以下作品和资源之上。我们感谢 jd-opensource 对 JoyAI-Image 存储库的贡献,jd-opensource 对 JoyAI-Image ComfyUI 工作流的贡献,以及 jdopensource 对 JoyAI-Image-Edit 模型的贡献。有关权威细节,请参阅下面链接的原始文档和存储库。
资源
- jd-opensource/JoyAI-Image
- GitHub: jd-opensource/JoyAI-Image
- jd-opensource/joyai_image_comfyui
- GitHub: jd-opensource/JoyAI-Image
- jdopensource/JoyAI-Image-Edit
- Hugging Face: jdopensource/JoyAI-Image-Edit
注意:使用参考的模型、数据集和代码需遵循其作者和维护者提供的各自许可和条款。

