FireRed 图像编辑 1.1:在 ComfyUI 中快速、基于指令的图像编辑
FireRed 图像编辑 1.1 是一个用于目标指令的 ComfyUI 工作流程。给它一个源图像和自然语言指令,它将在保持构图和特性的同时应用精确的更改。它由 FireRed 图像编辑 1.1 扩散变压器提供支持,并由 Qwen2.5-VL 7B 视觉语言编码器指导,因此您的编辑遵循图像显示的内容和您的提示意图。
该工作流程还包括一个 Lightning LoRA 涡轮模式,大大减少推理步骤以快速迭代。当您需要可控的、高保真的编辑以进行服装更改、风格转换、场景调整或直接在 ComfyUI 内进行细微细节改进时,请使用 FireRed 图像编辑 1.1。
Comfyui FireRed 图像编辑 1.1 工作流程中的关键模型
- FireRed 图像编辑 1.1 扩散变压器。专为遵循指令的图像编辑而设计的核心生成器;它根据您的提示和源图像进行调整,以保持布局和特性。模型卡
- FireRed 图像编辑 1.0 Lightning LoRA (8-step)。一个轻量级的加速适配器,启用涡轮模式,减少采样步骤以进行快速预览并强烈遵循编辑。模型卡
- Qwen2.5-VL 7B。用作编码器的多模态视觉语言模型,解释您的指令与图像内容,从而产生稳健的条件以控制编辑。模型卡
- Qwen 图像 VAE。用于将源图像编码为潜在变量以进行编辑并将最终结果解码回像素的图像自动编码器。包括在 FireRed 1.0 资产中。文件
如何使用 Comfyui FireRed 图像编辑 1.1 工作流程
概览,该工作流程从加载您的源图像开始,将其编码为潜在变量,从您的指令中使用 Qwen2.5-VL 7B 构建条件,然后通过采样器运行 FireRed 图像编辑 1.1 以生成编辑后的图像。单一涡轮切换控制 Lightning LoRA 是否激活,这也切换步骤计数和指导强度以提高速度或质量。
模型
此组加载 FireRed 图像编辑 1.1 扩散变压器,并可选地注入 Lightning LoRA。当启用涡轮时,LoRA 应用于基础模型以加速采样。模型采样节点配置了专为 FireRed 变压器设计的计划,因此编辑保持稳定。然后,指导归一化步骤准备模型,以便在不同提示间保持一致的条件。
提示
这是您编写驱动 FireRed 图像编辑 1.1 的指令的地方。Qwen2.5-VL 7B 编码器读取源图像和您的文本,以理解现有内容和应更改的内容。您可以选择性地添加最多两个参考图像以引导风格、服装、照明或其他属性。工作流程还包括一个伴随编码器路径作为负面或平衡通道,以保持输出干净和准确。
图像编码
您的源图像会自动调整为对模型友好的分辨率,然后编码到 VAE 潜在空间。这个潜在变量成为图像到图像编辑的起点,允许 FireRed 图像编辑 1.1 保持构图、相机几何和特性。编码的潜在变量直接流向采样器,在那里应用编辑。
步骤设置
此组根据涡轮切换切换采样器步骤计数。当涡轮开启时,步骤保持最小以进行快速预览;当涡轮关闭时,使用更高的步骤计数以达到最大保真度。使用涡轮快速探索方向,然后禁用它以获得最终的高质量渲染。
CFG 设置
分类器无指导强度也由同一涡轮切换切换。较低的指导值与涡轮模式配对,以在较少步骤下保持编辑稳定,而较高的值用于完整模型以增强提示遵循。工作流程会自动连接这些,以便您可以专注于指令而不是微观管理参数。
采样器设置
采样器结合了修补的 FireRed 模型、您的正面和负面条件,以及编码的潜在变量以生成编辑后的图像。您可以设置种子以使结果可重复,或更改它以探索替代方案。解码后的图像会保存到您的输出文件夹中,并带有清晰的前缀,以便您可以轻松批量和比较迭代。
Comfyui FireRed 图像编辑 1.1 工作流程中的关键节点
TextEncodeQwenImageEditPlus (Positive) (#118)
此节点将您的自然语言编辑指令和一到三张图像转化为 FireRed 图像编辑 1.1 的条件。使用简洁、指导性的措辞,如“将夹克更换为红色皮革带银色拉链”或“转换为水彩风格,边缘柔和”。可选的 image2 和 image3 可以锁定风格、服装或照明参考;保持它们与您的目标视觉一致。如果编辑过强,请降低描述强度或添加澄清约束。
Enable Lightning LoRA? (#153)
此切换激活 Lightning LoRA 涡轮路径。启用时,工作流程将模型切换到 LoRA 增强版,将采样从大约 40 步减少到约 8 步,并降低指导以在高速下保持结果稳定。使用它快速迭代提示和参考,然后关闭它以获得最终的高质量输出。
LoraLoaderModelOnly (#151)
此节点将 FireRed 图像编辑 1.0 Lightning LoRA 注入基础 FireRed 图像编辑 1.1 模型。如果您调整 LoRA 强度,请记住更高的值会增加编辑强度,但可能会过度调整风格或引入伪影。对于身份关键的编辑,保持强度适中,依靠更清晰的指令或额外的参考图像,而不是过度推动 LoRA。
KSampler (#130)
采样器是编辑强度、指导和步骤汇集的地方。关闭涡轮时,增加 steps 提高细节并减少轻微伪影;开启涡轮时,保持步骤较低以提高速度并依赖提示清晰度和参考。谨慎调整 cfg:较高的值强调指令,而较低的值优先考虑对源图像的保真度。对于重大场景更改,提高 cfg 并考虑更多步骤;对于细微调整,降低 cfg 和更少的步骤以保持特性。
可选附加功能
- 将编辑写成清晰的指令,而不是完整描述整个图像。“将 T 恤换成海军蓝西装外套;保持姿势和照明”比长篇叙述效果更好。
- 使用可选的
image2和image3输入来锚定风格或服装细节。将相机角度和构图与源图像匹配,以获得最佳传输效果。 - 开始时启用涡轮以探索想法,然后禁用涡轮以进行最终确认。由于较高的步骤计数和更强的指导,预期会有轻微差异。
- 为了最大程度地保持特性,请保持
cfg保守,使用简短、具体的指令,并在可能时提供紧密匹配的参考图像。 - 一旦确定方向,请保存固定种子,以便您可以在运行中仅测试指令或参考图像的 A/B。
资源
- FireRed 图像编辑 1.1 模型:FireRedTeam/FireRed-Image-Edit-1.1-ComfyUI
- Lightning LoRA 和 VAE 资产:FireRedTeam/FireRed-Image-Edit-1.0-ComfyUI
- Qwen2.5-VL 7B 编码器:Qwen/Qwen2.5-VL-7B-Instruct
- ComfyUI 项目(节点参考):comfy-org/ComfyUI
致谢
此工作流程实现并建立在以下作品和资源之上。我们感谢 FireRedTeam 提供的 FireRed 图像编辑 1.1 扩散模型,FireRedTeam 提供的 FireRed 图像编辑 1.0 Lightning LoRA,以及 Comfy.org 提供的 Comfy.org 官方工作流程。有关权威详情,请参阅下文链接的原始文档和存储库。
资源
- FireRedTeam/FireRed 图像编辑 1.1 扩散模型
- GitHub: FireRedTeam/FireRed-Image-Edit
- Hugging Face: FireRedTeam/FireRed-Image-Edit-1.1-ComfyUI
- arXiv: 2602.13344
- FireRedTeam/FireRed 图像编辑 1.0 Lightning LoRA
- GitHub: FireRedTeam/FireRed-Image-Edit
- Hugging Face: FireRedTeam/FireRed-Image-Edit-1.0-ComfyUI
- arXiv: 2602.13344
- Comfy.org/Comfy.org 官方工作流程
- GitHub: Comfy-Org/workflow_templates
- 文档 / 发布说明: FireRed 图像编辑 1.1: 图像编辑
注意:使用所引用的模型、数据集和代码需遵循其作者和维护者提供的各自许可和条款。

