此工作流程提供由 Qwen 家族驱动的快速、可控的图像编辑。通过单个提示,您可以进行图像修复、替换背景、插入或移除对象,并应用电影级重新照明,同时保留局部细节。Qwen 图像编辑非常适合希望进行精准转换的艺术家和创作者,而无需与复杂的节点图形斗争。
图形被组织为简单的步骤:加载模型、上传图像、编写提示,然后采样并保存。它附带一个可选的 Lightning LoRA,用于超快速的 4 步编辑,使您可以快速迭代并锁定所需外观。
qwen_image_edit_fp8_e4m3fn.safetensors
形式打包。qwen_2.5_vl_7b_fp8_scaled.safetensors
。qwen_image_vae.safetensors
形式分发。Qwen-Image-Lightning-4steps-V1.0.safetensors
。图形使用 UNETLoader
(#37) 加载编辑 UNet,使用 CLIPLoader
(#38) 加载文本编码器,并使用 VAELoader
(#39) 加载潜在编解码器。如果您希望更快的迭代,请切换可选的 LoraLoaderModelOnly
(#89) 以在基础模型上应用 Lightning LoRA。ModelSamplingAuraFlow
(#66) 和 CFGNorm
(#75) 准备采样器,以便 Qwen 图像编辑模型干净地遵循提示而不会过度细节化。
使用 LoadImage
(#78) 选择您要修改的照片。图像通过 ImageScaleToTotalPixels
(#93) 以保持分辨率在质量友好的范围内,这有助于 Qwen 图像编辑避免来自超大输入的伪影。VAEEncode
(#88) 将像素转换为潜在以实现高效编辑,同时保留结构。
在 TextEncodeQwenImageEdit
(#76) 中将您的指令写成正面指导。示例包括“将背景替换为日落城市景观”、“移除背景中的人”或“从左侧投射柔和的金色主光”。当您需要避免更改时,使用第二个 TextEncodeQwenImageEdit
(#77) 作为负面指导,例如“不要改变主体的面部”或“保持夹克的颜色”。两个编码器都能看到您上传的图像和 VAE,因此调节保持与内容一致。
KSampler
(#3) 使用修补后的模型和您的调节执行编辑。如果启用了 Lightning LoRA,您可以在很少的步骤中收敛;否则,请使用更多步骤以获得最大保真度。编辑后的潜在通过 VAEDecode
(#8) 解码并通过 SaveImage
(#60) 写入磁盘。
TextEncodeQwenImageEdit
(#76)编码驱动编辑的主要指令。偏好使用直接动词如“替换”、“插入”、“移除”、“重新着色”和“重新照明”。如果更改是局部的,请明确命名区域或对象。保持提示简洁;长列表的风格标签通常不需要。
TextEncodeQwenImageEdit
(#77)提供负面或保护性指导。用它来告知模型应避免的内容或保留关键属性。良好的模式包括:“保持肤色”、“不要改变构图”、“忽略背景文本”。
LoraLoaderModelOnly
(#89)应用 Qwen-Image-Lightning LoRA 以实现快速迭代。当您需要近乎即时的结果时,请打开它。LoRA 激活时,显著减少采样器步骤以保持清晰的编辑。
ImageScaleToTotalPixels
(#93)将过大的输入缩小到目标百万像素预算以稳定质量。当源图像非常大或包含重压缩时使用;它通常改善边缘平滑度并减少光晕。
CFGNorm
(#75)规范化无分类器指导行为,使模型遵循提示而不会产生伪影。如果您看到过度饱和或“过度编辑”,请稍微降低强度;如果编辑感觉胆怯,请稍微提高。
KSampler
(#3)运行扩散循环。对于 fp8,从适度的步骤开始,并仅在编辑不完整时增加。保持指导适中;非常高的值可能会冲淡保留的区域。当 Lightning LoRA 打开时,使用极少的步骤以捕捉其速度优势。
此工作流程实现并构建在以下作品和资源之上。我们感谢 QwenLM 为 Qwen-Image-Edit 和 Qwen-Image 以及 ComfyOrg 为 ComfyUI Native Workflow Example 的贡献和维护。有关权威详细信息,请参阅下文链接的原始文档和存储库。
注意:使用引用的模型、数据集和代码需遵循其作者和维护者提供的相应许可证和条款。
RunComfy 是首选的 ComfyUI 平台,提供 ComfyUI 在线 环境和服务,以及 ComfyUI 工作流 具有惊艳的视觉效果。 RunComfy还提供 AI Playground, 帮助艺术家利用最新的AI工具创作出令人惊叹的艺术作品。