Qwen Image Edit 2511 for ComfyUI: 基于指令的单图像编辑和多图像参考
此工作流程将 Qwen Image Edit 2511 引入 ComfyUI,以进行精确的、基于指令的编辑,保留源图像的结构和身份。它支持单图像编辑和多图像参考用例,能够进行风格转移、材质或对象替换、属性更改和自然、一致的视觉增强。
基于视觉语言编码器加扩散变压器,图表将纯英文指令转换为一致的图像编辑。可选的 Lightning LoRA 使 Qwen Image Edit 2511 的生成速度加快而不牺牲对齐,因此艺术家和产品团队可以快速迭代创意图像编辑、角色重塑和专业内容优化。
想要更简单且无节点的体验?尝试 Playground 版本以探索 Qwen Image Edit 2511 Playground 而无需使用 ComfyUI 节点,只需上传图像并通过文本指令进行编辑。
ComfyUI Qwen Image Edit 2511 工作流程中的关键模型
- Qwen‑Image‑Edit‑2511。用于编辑的核心扩散变压器,比 2509 提高了一致性,旨在遵循指令同时保持身份和几何稳定。Hugging Face: Qwen/Qwen-Image-Edit-2511
- Qwen2.5‑VL‑7B‑Instruct。用作文本/图像理解骨干的视觉语言编码器;它将您的指令与视觉上下文对齐以进行基于指令的编辑。Hugging Face: Qwen/Qwen2.5-VL-7B-Instruct
- Qwen Image VAE。匹配的变分自编码器,在像素空间和模型的潜在空间之间映射以实现忠实重构。(文件通过 Comfy‑Org 包提供。)Hugging Face: Comfy-Org/Qwen-Image_ComfyUI
- Qwen‑Image‑Edit‑2511‑Lightning(可选)。一个 4 步加速 LoRA,显著加快采样器的速度,同时保持编辑在指令上的准确性;在您需要快速预览或近实时单图像编辑时启用。Hugging Face: lightx2v/Qwen-Image-Edit-2511-Lightning
如何使用 ComfyUI Qwen Image Edit 2511 工作流程
此图表包含两个并行轨道:“多图像”用于跨图像的属性/材质转移和“单图像”用于直接的基于指令的编辑。两个轨道共享相同的模型加载器和采样器逻辑,并以预览和保存节点结束。选择与您的任务匹配的轨道,编写明确的指令并排队运行。
多图像 › 加载图像
使用此组加载两个参考图像:第一个是您要编辑的基础,第二个提供要转移的外观、材质或属性。图像会自动调整为平衡的工作尺寸,以保持布局并避免扩散期间的伪影。如果可能,请选择具有相似框架或视点的参考,以改善对齐。此路径支持诸如“用右侧图像中的材料替换左侧图像中的椅子材料,同时保持形状和结构”的任务。
多图像 › 提示
撰写简短、明确的指令,描述编辑目标以及第二个图像应如何影响第一个图像。例如:“用图 2 的皮革替换图 1 的椅子材料,保持框架不变,匹配光照。”指令被传递给 Qwen2.5‑VL 编码器,该编码器将文本固定在加载的视觉上,以实现可靠的图像编辑。避免冲突的目标;指定必须保持不变的内容以获得身份安全的结果。
多图像 › 加载模型
此组加载 Qwen Image Edit 2511 扩散模型、Qwen2.5‑VL 编码器和 Qwen Image VAE。您可以选择性地启用 Lightning LoRA,以在保持指令遵循的同时加速编辑。除非您有理由更换变体,否则请按照模板提供的模型选择。
多图像 › KSampler 和输出
采样器执行受控扩散以实现请求的编辑,使用来自指令的正向条件和归零的负向条件以减少意外更改。结果由 VAE 解码,并自动与参考图像拼接以进行并排预览,使验证单图像编辑是否遵循您的指令变得容易。根据需要保存合成图像或仅保存编辑后的图像。
单图像 › 加载图像
拖放一个源图像进行编辑。缩放阶段将其准备到目标工作尺寸,以便组合保持稳定,小细节保持清晰。这是当您不需要风格或材质捐赠图像时用于基于指令的编辑的最清洁路径。
单图像 › 提示
撰写直接的指令,命名主题和确切的更改。良好的模式包括“保持 X,更改 Y”,“增强 Z”或“使用相同的构图重新设计为 [风格]”。指令与视觉上下文由编码器融合,因此扩散模型可以在保持身份和几何形状的同时应用精确的单图像编辑。
单图像 › 加载模型
模型加载器初始化 Qwen Image Edit 2511、Qwen2.5‑VL 和 VAE。可选地启用 Lightning LoRA 以获得更快的预览和快速迭代。如果禁用 LoRA,基础模型将优先考虑最大忠实度和一致性。
单图像 › KSampler 和输出
采样器使用从编码器派生的条件执行您的编辑,然后解码为图像。使用预览来评估编辑是否满足指令而未偏离原始外观。满意后保存最终图像。
ComfyUI Qwen Image Edit 2511 工作流程中的关键节点
TextEncodeQwenImageEditPlusAdvance_lrzjason (#13, #64)
- 角色:将您的指令与一个或多个参考图像打包为指导 Qwen Image Edit 2511 的条件。对于多图像任务,请在指令中明确提及第一和第二图像以控制转移内容。如果看到过度编辑,请使指令更具约束性(例如,“不要改变姿势或光照”),并保持描述锚定在图像中的实际对象。
KSampler (#48, #72)
- 角色:驱动扩散过程,将条件转化为最终编辑。启用 Lightning LoRA 时,使用非常少的步骤和低引导以提高速度;未启用时,增加步骤以获得最大忠实度。如果结果偏移,降低引导;如果变化过于微妙,增加一些引导或步骤。
LoraLoaderModelOnly (#49, #68)
- 角色:注入 Qwen‑Image‑Edit‑2511‑Lightning LoRA 以进行 4 步加速。保持权重在默认值附近以获得忠实结果,并在您想要与基础模型的质量进行比较或优化复杂编辑时将其关闭。
FluxKontextImageScale (#5, #6, #62)
- 角色:将输入调整为稳定的工作尺寸,以便编码器和采样器看到一致的空间上下文。在大多数情况下保持开启;如果必须精确保留原始分辨率,请先在此处调整,然后用采样器进行优化。
可选附加项
- 撰写命名主体和范围的指令:“将夹克颜色更改为海军蓝,保持织物纹理和光照”比模糊的风格提示更能产生可靠的图像编辑。
- 对于多图像转移,选择与基础图像具有相似视点和光照的捐赠者;这改善了材质和风格匹配。
- 启用 Lightning 进行快速预览时,如果需要绝对最高的忠实度,请使用标准运行确认最终结果。
- 如果编辑触及框架的太多部分,添加约束如“保持背景不变”或“保留面部特征”以收紧单图像编辑行为。
参考
- Qwen‑Image‑Edit‑2511 模型卡:Hugging Face
- Qwen2.5‑VL‑7B‑Instruct:Hugging Face
- Qwen Image VAE 和 ComfyUI 的打包文件:Hugging Face
- Qwen‑Image‑Edit‑2511‑Lightning LoRA:Hugging Face
- Qwen‑Image 技术报告:arXiv
致谢
此工作流程实现并构建在以下作品和资源之上。我们感谢 Qwen 提供 Qwen-Image-Edit-2511 模型的贡献和维护。有关权威详细信息,请参阅以下链接的原始文档和存储库。
资源
- Qwen/Qwen-Image-Edit-2511
- GitHub: QwenLM/Qwen-Image
- Hugging Face: Qwen/Qwen-Image-Edit-2511
- arXiv: 2508.02324
注意:使用所引用的模型、数据集和代码须遵循其作者和维护者提供的相应许可证和条款。


