Qwen 图像编辑流程在 ComfyUI 中 | 图像修复, 重新照明, 风格迁移

Qwen 图像编辑 for ComfyUI: 基于提示的照片编辑、替换和重新照明

此工作流程提供由 Qwen 家族驱动的快速、可控的图像编辑。通过单个提示，您可以进行图像修复、替换背景、插入或移除对象，并应用电影级重新照明，同时保留局部细节。Qwen 图像编辑非常适合希望进行精准转换的艺术家和创作者，而无需与复杂的节点图形斗争。

图形被组织为简单的步骤：加载模型、上传图像、编写提示，然后采样并保存。它附带一个可选的 Lightning LoRA，用于超快速的 4 步编辑，使您可以快速迭代并锁定所需外观。

Comfyui Qwen 图像编辑工作流程中的关键模型

Qwen 图像编辑扩散模型 核心图像编辑 UNet 用于指导编辑指令。在 Comfy-Org/Qwen-Image-Edit_ComfyUI 中以 qwen_image_edit_fp8_e4m3fn.safetensors 形式打包。
Qwen 2.5 VL 7B 文本编码器 多模态文本编码器，用于解释编辑指令并调节模型。在 Comfy-Org/Qwen-Image_ComfyUI 中提供为 qwen_2.5_vl_7b_fp8_scaled.safetensors。
Qwen 图像 VAE 专为 Qwen 图像模型量身定制的潜在编解码器，提升重建质量。在 Comfy-Org/Qwen-Image_ComfyUI 中以 qwen_image_vae.safetensors 形式分发。
Qwen-Image-Lightning LoRA (可选) 速度优化的 LoRA，能够在仅 4 步内实现高质量编辑。在 lightx2v/Qwen-Image-Lightning 上可用为 Qwen-Image-Lightning-4steps-V1.0.safetensors。

如何使用 Comfyui Qwen 图像编辑工作流程

第一步 – 加载模型

图形使用 UNETLoader (#37) 加载编辑 UNet，使用 CLIPLoader (#38) 加载文本编码器，并使用 VAELoader (#39) 加载潜在编解码器。如果您希望更快的迭代，请切换可选的 LoraLoaderModelOnly (#89) 以在基础模型上应用 Lightning LoRA。ModelSamplingAuraFlow (#66) 和 CFGNorm (#75) 准备采样器，以便 Qwen 图像编辑模型干净地遵循提示而不会过度细节化。

第二步 – 上传待编辑图像

使用 LoadImage (#78) 选择您要修改的照片。图像通过 ImageScaleToTotalPixels (#93) 以保持分辨率在质量友好的范围内，这有助于 Qwen 图像编辑避免来自超大输入的伪影。VAEEncode (#88) 将像素转换为潜在以实现高效编辑，同时保留结构。

第三步 – 提示

在 TextEncodeQwenImageEdit (#76) 中将您的指令写成正面指导。示例包括“将背景替换为日落城市景观”、“移除背景中的人”或“从左侧投射柔和的金色主光”。当您需要避免更改时，使用第二个 TextEncodeQwenImageEdit (#77) 作为负面指导，例如“不要改变主体的面部”或“保持夹克的颜色”。两个编码器都能看到您上传的图像和 VAE，因此调节保持与内容一致。

采样和输出

KSampler (#3) 使用修补后的模型和您的调节执行编辑。如果启用了 Lightning LoRA，您可以在很少的步骤中收敛；否则，请使用更多步骤以获得最大保真度。编辑后的潜在通过 VAEDecode (#8) 解码并通过 SaveImage (#60) 写入磁盘。

Comfyui Qwen 图像编辑工作流程中的关键节点

`TextEncodeQwenImageEdit` (#76)

编码驱动编辑的主要指令。偏好使用直接动词如“替换”、“插入”、“移除”、“重新着色”和“重新照明”。如果更改是局部的，请明确命名区域或对象。保持提示简洁；长列表的风格标签通常不需要。

`TextEncodeQwenImageEdit` (#77)

提供负面或保护性指导。用它来告知模型应避免的内容或保留关键属性。良好的模式包括：“保持肤色”、“不要改变构图”、“忽略背景文本”。

`LoraLoaderModelOnly` (#89)

应用 Qwen-Image-Lightning LoRA 以实现快速迭代。当您需要近乎即时的结果时，请打开它。LoRA 激活时，显著减少采样器步骤以保持清晰的编辑。

`ImageScaleToTotalPixels` (#93)

将过大的输入缩小到目标百万像素预算以稳定质量。当源图像非常大或包含重压缩时使用；它通常改善边缘平滑度并减少光晕。

`CFGNorm` (#75)

规范化无分类器指导行为，使模型遵循提示而不会产生伪影。如果您看到过度饱和或“过度编辑”，请稍微降低强度；如果编辑感觉胆怯，请稍微提高。

`KSampler` (#3)

运行扩散循环。对于 fp8，从适度的步骤开始，并仅在编辑不完整时增加。保持指导适中；非常高的值可能会冲淡保留的区域。当 Lightning LoRA 打开时，使用极少的步骤以捕捉其速度优势。

可选附加功能

简单描述编辑。Qwen 图像编辑对简短、可操作的指令响应最佳，如“使天空阴云密布并添加雨水”或“将广告牌文字替换为白色的‘RunComfy’”。
对于背景替换，指定新场景和氛围，例如“用黄昏的天际线替换背景，橙色薄雾，微弱的城市灯光”。
对于对象操作，结合动作和位置：“在主体的右手插入一把红色雨伞”或“移除左侧的垃圾桶”。
对于重新照明，命名方向、质量和强度：“从相机右侧投射柔和的主光，微妙的边缘光，暖色调。”
如果结果看起来过度处理，降低指导或禁用 LoRA；如果编辑过于薄弱，稍微增加步骤或加强指令。

致谢

此工作流程实现并构建在以下作品和资源之上。我们感谢 QwenLM 为 Qwen-Image-Edit 和 Qwen-Image 以及 ComfyOrg 为 ComfyUI Native Workflow Example 的贡献和维护。有关权威详细信息，请参阅下文链接的原始文档和存储库。

资源

Comfy/Qwen Image-Edit 参考
- GitHub: QwenLM/Qwen-Image
- Hugging Face: Qwen/Qwen-Image-Edit
- arXiv: Qwen-Image 技术报告
- 文档/发布说明: Qwen-Image-Edit ComfyUI Native Workflow Example

注意：使用引用的模型、数据集和代码需遵循其作者和维护者提供的相应许可证和条款。

Want More ComfyUI Workflows?

Wan 2.2 | 开源视频生成领导者

现已推出！更高精度 + 更流畅的运动。

Wan 2.2 + Lightx2v V2 | 超快速 I2V & T2V

双 Light LoRA 设置，速度提高 4 倍。

Wan 2.2 图像生成 | 2合1工作流程包

MoE Mix + 仅低噪声模式，带放大。选择一个。

Wan 2.2 Lightning T2V I2V | 4步超高速

Wan 2.2 现在快20倍！T2V + I2V 仅需4步。

Wan 2.2 低 Vram | Kijai 包装器

低 VRAM。不再等待。包含 Kijai 包装器。

CogVideoX-5B | 先进的文本到视频模型

CogVideoX-5B：用于高质量视频生成的先进文本到视频模型。

Hunyuan Image 2.1 | 高分辨率AI图像生成器

下一代2.1模型，用于快速生成清晰锐利、超高清的AI视觉效果。

Nunchaku Qwen 图像 | 多图像编辑器

以高级控制融合和风格化多张图像。

关注我们

支持

资源

法律

RunComfy

RunComfy 是首选的 ComfyUI 平台，提供 ComfyUI 在线环境和服务，以及 ComfyUI 工作流具有惊艳的视觉效果。 RunComfy还提供 AI Models, 帮助艺术家利用最新的AI工具创作出令人惊叹的艺术作品。

Qwen 图像编辑 | 精准 AI 照片编辑