LongCat Image Edit Turbo: 在ComfyUI中快速提示引导的图像编辑#
LongCat Image Edit Turbo是一个专为快速提示引导编辑而设计的ComfyUI工作流程,保持您的主题和构图完整。它结合了LongCat Image Edit Turbo模型与Qwen2.5-VL条件和AE VAE,以快速、可迭代的循环提供角色重塑、类似遮罩的局部变化和电影灯光调整。
专为创作者和高级用户设计,此LongCat Image Edit Turbo图形接受任何来源图像,通过视觉语言编码器解释您的编辑意图,并返回保留原始框架的高保真结果。它是RunComfy-ready并优化用于快速预览和受控精炼。
Comfyui LongCat Image Edit Turbo工作流程中的关键模型#
- LongCat Image Edit Turbo (bf16)。驱动快速、保留构图的图像编辑的扩散模型,同时对文本指导有强烈响应。模型文件
- Qwen2.5-VL 7B文本编码器(FP8缩放,ComfyUI打包)。通过理解您的提示和输入图像的视觉上下文来生成丰富的条件。编码器文件
- AE VAE (ae.safetensors)。从低损失的潜在中重建图像,帮助LongCat Image Edit Turbo在采样后保留细节。VAE文件
如何使用Comfyui LongCat Image Edit Turbo工作流程#
工作流程从您的图像和提示到解码结果遵循清晰的路径。阶段围绕几个决定性组件组织,保持编辑快速稳定。
加载并准备您的源图像#
- 使用
LoadImage(#79)导入您的图片。图形通过FluxKontextImageScale(#64)路由以标准化比例以进行稳健编辑。 - 然后图像通过
GetImageSize(#72)和EmptyLatentImage(#61)设置工作画布,这有助于LongCat Image Edit Turbo保持构图和主题位置。 - 这种准备确保后续编辑像智能、类似遮罩的调整,而不是整体重新合成。
使用Qwen编码您的编辑意图#
- 工作流程使用
CLIPLoader(#19)加载Qwen2.5-VL编码器。 - 在
TextEncodeQwenImageEditPlus (Positive)(#53)中描述您想要的更改。使用清晰的风格、灯光或属性提示以供LongCat Image Edit Turbo应用。 - 使用
TextEncodeQwenImageEditPlus (Negative)(#54)列出要避免或保护的元素,这有助于保持身份和避免不必要的更改。 - 编码器读取您的文本和源图像,创建编辑感知的条件,将更改锚定在原始场景中。
指导和参考混合#
FluxGuidance(#21)和FluxGuidance(#22)调整正负指令对结果的影响力度。更高的强调推向更大胆的编辑;更低的强调则偏向于微妙的、保留构图的调整。FluxKontextMultiReferenceLatentMethod(#51)和FluxKontextMultiReferenceLatentMethod(#52)控制如果您选择添加,如何混合多个参考。默认情况下,标记为“DO NOT USE (LEAVE BYPASSED)”的辅助子图保持不活动;如果您想要额外的风格或属性参考,请用您自己的图像加载器替换它。
运行采样器#
- LongCat Image Edit Turbo UNet由
UNETLoader(#18)加载,并通过CFGNorm(#23)标准化以获得稳定的指导。 KSampler(#27)执行实际的扩散步骤,将您的意图和上下文转化为新的潜在。首先进行快速迭代以进行预览,然后根据需要精炼您的提示或指导强度以获得最终质量。- 保持每次编辑专注于一个清晰的目标,以获得最可预测的结果。
解码和导出#
- AE VAE通过
VAELoader(#20)引入,并由VAEDecode(#25)用于从采样的潜在中高保真地重建图像。 SaveImage(#9)将结果写入您的输出目录,带有清晰的前缀,使其易于跟踪不同运行的变化。
Comfyui LongCat Image Edit Turbo工作流程中的关键节点#
TextEncodeQwenImageEditPlus (Positive)(#53)。使用Qwen2.5-VL和源图像将您想要的更改转换为编辑感知的条件。将您的提示集中在您想要的主题和更改上,例如服装、氛围、灯光或材料,以指导LongCat Image Edit Turbo而不偏离场景。TextEncodeQwenImageEditPlus (Negative)(#54)。通过指定要避免的内容来保护身份和构图。使用它来减少伪影或防止不必要的重塑,同时保持场景一致。FluxGuidance(#21)。调整积极指令推动编辑的力度。增加以实现更强的重塑或戏剧性照明;减少以保留更多原始外观。根据您的提示详细程度和提供的参考数量来平衡这一点。FluxKontextMultiReferenceLatentMethod(#51)。确定如何将多个参考混合到条件中。选择与您的目标匹配的方法,例如用于风格转移的更强融合与用于属性微调的较轻影响。CFGNorm(#23)。标准化指导行为,以便更改在不同设置中保持一致。这有助于LongCat Image Edit Turbo在您迭代提示或切换采样器时保持稳定。KSampler(#27)。生成的核心。使用它快速迭代,锁定种子以实现可重复性,并在您喜欢的方向上尝试不同的采样器。与FluxGuidance一起调整以权衡编辑强度与对原始的忠实度。FluxKontextImageScale(#64)。准备并缩放输入图像以供下游节点使用。此步骤对于在编辑过程中保持框架和比例稳定至关重要。
可选附加功能#
- 添加更多参考。如果您想要多图像指导,请用您自己的
LoadImage节点替换绕过的辅助子图,并将它们插入Qwen编码节点的额外参考输入中。这对于风格或衣橱转移而保持姿势和布局非常有用。 - 快速迭代技巧。从简短的提示开始,运行快速预览,然后精炼措辞或指导强度。使用种子再现您最喜欢的外观并分支出小变体。
- 通过措辞实现局部更改。明确指定目标,例如“仅将夹克更改为红色”或“在主题上添加柔和的边缘光”,以驱动类似遮罩的编辑,而不需要明确的遮罩。
- GGUF变体。对于CPU或非常低的VRAM场景,您可以使用
UnetLoaderGGUF(#77)切换到量化的LongCat Image Edit Turbo权重。查看GGUF包以获取可用量化。模型变体
致谢#
此工作流程实现并建立在以下工作和资源之上。我们感谢Comfy-Org为LongCat Image Edit Turbo和相关组件所做的贡献,vantagewithai为LongCat Image Edit Turbo GGUF模型所做的贡献,以及Civitai社区为LongCat Image Edit Turbo工作流程的贡献和维护。有关权威详情,请参阅下面链接的原始文档和存储库。
资源#
- Civitai/Civitai工作流程源
- 文档/发布说明:Civitai模型页面
- Comfy-Org/LongCat Image Edit Turbo bf16模型
- Hugging Face: Comfy-Org/LongCat-Image
- vantagewithai/LongCat Image Edit Turbo GGUF模型
- Hugging Face: vantagewithai/LongCat-Image-Edit-Turbo-GGUF
- Comfy-Org/Qwen 2.5 VL文本编码器
- Hugging Face: Comfy-Org/Qwen-Image_ComfyUI
- Comfy-Org/AE VAE
- Hugging Face: Comfy-Org/z_image_turbo
注意:使用引用的模型、数据集和代码需遵循其作者和维护者提供的各自许可证和条款。









