logo
RunComfy
ComfyUIPlaygroundPricing
discord logo
ComfyUI>工作流>Nunchaku Qwen 图像 | 多图像编辑器

Nunchaku Qwen 图像 | 多图像编辑器

Workflow Name: RunComfy/Nunchaku-Qwen-Image
Workflow ID: 0000...1301
通过此工作流程,您可以合并、转换和增强多个参考图像,以实现一致的高质量合成。它使用 Qwen 模型提供先进的多图像融合、背景控制和基于提示的风格调整。对于寻求精细创意控制的设计师和数字艺术家来说,它简化了复杂的编辑,同时保持自然细节。非常适合创作动态视觉效果或轻松尝试多个来源。

Nunchaku Qwen 图像多图像编辑和合成用于 ComfyUI

Nunchaku Qwen 图像是一个基于提示的多图像编辑和合成工作流程,适用于 ComfyUI。它接受多达三张参考图像,让您指定它们如何混合或转换,并通过自然语言指导生成一致的结果。典型的用例包括合并主体、更换背景或从一张图像到另一张图像的风格和细节转移。

围绕 Qwen 图像系列构建,此工作流程为艺术家、设计师和创作者提供精确控制,同时保持快速和可预测。它还包括单图像编辑路径和纯文本到图像路径,因此您可以在一个 Nunchaku Qwen 图像管道中生成、完善和合成。

注意:请选择 Medium 到 2XLarge 范围内的机器类型。使用 2XLarge Plus 或 3XLarge 机器类型不受支持,将导致运行失败。

Comfyui Nunchaku Qwen 图像工作流程中的关键模型

  • Nunchaku Qwen 图像编辑 2509。编辑调整的扩散/DiT 权重,优化用于提示引导的图像编辑和属性转移。擅长局部编辑、对象替换和背景更改。 Model card

  • Nunchaku Qwen 图像(基础)。基于文本到图像分支的基础生成器,用于无源照片的创意合成。 Model card

  • Qwen2.5-VL 7B 文本编码器。多模态语言模型,解释提示并将其与视觉特征对齐以进行编辑和生成。 Model page

  • Qwen 图像 VAE。变分自动编码器,用于将源图像编码为潜在变量,并使用真实的颜色和细节解码最终结果。 Assets

如何使用 Comfyui Nunchaku Qwen 图像工作流程

此图包含三个独立的路线,分享相同的视觉语言和采样逻辑。根据您是编辑多张图像、精炼单张图像还是从文本生成,使用一个分支。

Nunchaku-qwen-image-edit-2509(多图像编辑和合成)

此分支加载编辑模型 NunchakuQwenImageDiTLoader (#115),通过 ModelSamplingAuraFlow (#66) 和 CFGNorm (#75) 路由,然后使用 KSampler (#3) 合成。使用 LoadImage (#78, #106, #108) 上传多达三张图像。主要参考由 VAEEncode (#88) 编码以设置画布,ImageScaleToTotalPixels (#93) 保持输入在稳定的尺寸范围内。

在 TextEncodeQwenImageEditPlus (#111) 中编写您的指令,如有必要,将移除或约束放在配对的 TextEncodeQwenImageEditPlus (#110) 中。明确引用来源,例如:“图像 1 中的狗戴着图像 2 中的绿帽子和图像 3 中的眼镜。” 如需自定义输出尺寸,您可以用 EmptySD3LatentImage (#112) 替换编码的潜在变量。结果由 VAEDecode (#8) 解码并使用 SaveImage (#60) 保存。

Nunchaku-qwen-image-edit(单图像精炼)

当您想对单张图像进行有针对性的清理、背景更改或风格调整时选择此项。模型由 NunchakuQwenImageDiTLoader (#120) 加载,由 ModelSamplingAuraFlow (#125) 和 CFGNorm (#123) 调整,并由 KSampler (#127) 采样。用 LoadImage (#129) 导入您的照片;它由 ImageScaleToTotalPixels (#130) 归一化,并由 VAEEncode (#131) 编码。

在 TextEncodeQwenImageEdit (#121) 中提供您的指令,并在 TextEncodeQwenImageEdit (#122) 中提供可选的反向指导,以保留或移除元素。该分支通过 VAEDecode (#124) 解码,并通过 SaveImage (#128) 写入文件。

Nunchaku-qwen-image(文本到图像)

使用此分支从基础模型创建新图像。NunchakuQwenImageDiTLoader (#146) 提供 ModelSamplingAuraFlow (#138)。在 CLIPTextEncode (#143) 和 CLIPTextEncode (#137) 中输入您的正面和负面提示。使用 EmptySD3LatentImage (#136) 设置您的画布,然后使用 KSampler (#141) 生成,使用 VAEDecode (#142) 解码,并使用 SaveImage (#147) 保存。

Comfyui Nunchaku Qwen 图像工作流程中的关键节点

NunchakuQwenImageDiTLoader (#115)
加载分支使用的 Qwen 图像权重和变体。选择用于照片引导编辑的编辑模型或用于文本到图像的基础模型。当 VRAM 允许时,更高精度或更高分辨率的变体可以提供更多细节;较轻的变体优先考虑速度。

TextEncodeQwenImageEditPlus (#111)
通过解析您的指令并将其绑定到多达三个参考,驱动多图像编辑。明确指示哪个图像贡献了哪个属性。使用简明的措辞,避免冲突的目标以保持编辑的集中。

TextEncodeQwenImageEditPlus (#110)
作为多图像分支的配对负面或约束编码器。使用它排除您不希望出现的对象、风格或伪影。这通常有助于在移除 UI 覆盖或不需要的道具时保留构图。

TextEncodeQwenImageEdit (#121)
单图像编辑分支的正面指令。用清晰的语言描述所需的结果、表面质量和构图。目标是用一到三句话指定场景和变化。

TextEncodeQwenImageEdit (#122)
单图像编辑分支的负面或约束提示。列出要避免的项目或特征,或描述要从源图像中移除的元素。这对于清除杂乱的文本、徽标或界面元素很有用。

ImageScaleToTotalPixels (#93)
通过缩放到目标总像素数来防止过大的输入导致结果不稳定。使用它在合成前调和不同来源的分辨率。如果您注意到来源之间清晰度不一致,请在此处将它们的有效尺寸调近。

ModelSamplingAuraFlow (#66)
应用为 Qwen 图像模型调整的 DiT/流匹配采样计划。如果输出看起来暗淡、模糊或缺乏结构,请增加计划的偏移以稳定全局色调;如果它们看起来平淡,请减少偏移以追求额外的细节。

KSampler (#3)
主采样器,您可以在其中平衡速度、保真度和随机多样性。调整步骤和指导尺度以在一致性与创意之间取得平衡,选择采样方法,并在您希望跨运行精确重现时锁定种子。

CFGNorm (#75)
标准化无分类器引导,以减少在较高引导尺度下的过饱和或对比度爆炸。按提供的路径保留它;它有助于在您迭代提示时保持稳定的颜色和曝光。

可选附加功能

  • 为获得最佳多图像效果,选择具有相似透视和照明的来源;Nunchaku Qwen 图像编辑模型然后专注于内容而不是修复几何。
  • 按顺序引用来源(“图像 1”、“图像 2”、“图像 3”),并明确指出哪些属性转移到哪里。
  • 当输出偏暗或模糊时,上调 ModelSamplingAuraFlow 的偏移;当您需要额外纹理时,尝试稍低的偏移。
  • 要设置特定分辨率,请在您使用的分支中用 EmptySD3LatentImage 替换编码的潜在变量。
  • 在您投入详细风格化之前,使用负面提示移除 UI 文本、水印或不需要的对象;这使得 Nunchaku Qwen 图像编辑从一开始就保持清洁。

致谢

此工作流程实施并基于以下作品和资源构建。我们衷心感谢 Nunchaku 为 Qwen-Image 工作流程(ComfyUI-nunchaku)所做的贡献和维护。有关权威详情,请参阅以下链接的原始文档和库。

资源

  • Nunchaku/Qwen-Image
    • GitHub: nunchaku-tech/ComfyUI-nunchaku
    • Hugging Face: nunchaku-tech/nunchaku-qwen-image
    • arXiv: SVDQuant: Absorbing Outliers by Low-Rank Components for 4-Bit Diffusion Models
    • Docs / Release Notes: Nunchaku Qwen Image Source

注意:所引用的模型、数据集和代码的使用受其作者和维护者提供的各自许可证和条款的约束。

Want More ComfyUI Workflows?

IPAdapter Plus(V2)|合并图像

IPAdapter Plus(V2)|合并图像

在 IPAdapter Plus 中使用各种合并方法,精确高效地控制图像混合。

IPAdapter Plus (V2) | 风格和构图

IPAdapter Plus (V2) | 风格和构图

IPAdapter Plus 能够有效地进行风格和构图迁移,其功能类似于单图像 LoRA。

IPAdapter Plus(V2)| 单图风格迁移

IPAdapter Plus(V2)| 单图风格迁移

使用 IPAdapter Plus 和 ControlNet 通过单个参考图像实现精准的风格迁移。

IPAdapter Plus (V2) | 更换服装

IPAdapter Plus (V2) | 更换服装

使用 IPAdapter Plus 进行时尚模特创作,轻松更换服装和风格

DynamiCrafter | 图像转视频

经测试可用于生成循环视频和帧插值。在某些场景下优于闭源视频生成工具

FLUX Kontext Preset | 场景控制

通过精心策划的一键式 AI 预设掌握场景创建。

幻想肖像 | 富有表现力的照片动画

照片 → 富有表现力的电影面部动画,快速且身份准确。

DiffuEraser | 视频修复

使用自动遮罩和真实的重建从视频中去除物体。

关注我们
  • 领英
  • Facebook
  • Instagram
  • Twitter
支持
  • Discord
  • 电子邮件
  • 系统状态
  • 附属
资源
  • 免费 ComfyUI 在线版
  • ComfyUI 指南
  • RunComfy API
  • ComfyUI 教程
  • ComfyUI 节点
  • 了解更多
法律
  • 服务条款
  • 隐私政策
  • Cookie 政策
RunComfy
版权 2025 RunComfy. 保留所有权利。

RunComfy 是首选的 ComfyUI 平台,提供 ComfyUI 在线 环境和服务,以及 ComfyUI 工作流 具有惊艳的视觉效果。 RunComfy还提供 AI Playground, 帮助艺术家利用最新的AI工具创作出令人惊叹的艺术作品。