Flux 2 Klein 9B KV 图像编辑:基于指令的编辑,保持构图和身份
Flux 2 Klein 9B KV 图像编辑是一个 ComfyUI 工作流程,用于精确的、基于指令的图像编辑,具有强大的身份和布局保留。提供一个或多个参考图像加上自然语言编辑提示,工作流程应用目标更改,如场景交换、风格转移或细节优化,同时保持您的主体完整。
基于 Black Forest Labs 的 FLUX.2 Klein 9B KV 模型构建,具有 KV 缓存以快速迭代,工作流程将现代文本编码器和 VAE 配对,以保持编辑忠实于您的提示和参考。它非常适合希望在 ComfyUI 内直接获得可控、高保真结果的创作者。
Comfyui Flux 2 Klein 9B KV 图像编辑工作流程中的关键模型
- Black Forest Labs 的 FLUX.2 Klein 9B KV FP8。用于图像生成和图像编辑的核心扩散骨干;KV 变体启用键值缓存以加速迭代推理和多参考条件。模型卡
- FLUX.2 的 Qwen 3 8B 文本编码器。将您的自然语言指令编码为嵌入,引导编辑朝向请求的属性、构图和风格。存储库
- FLUX.2 VAE。将参考图像编码为潜变量以进行条件处理,并将最终潜变量解码回高保真像素。存储库
如何使用 Comfyui Flux 2 Klein 9B KV 图像编辑工作流程
整体流程
- 工作流程加载模型堆栈,编码您的编辑指令,从一个或多个参考图像中提取指导,然后采样并解码最终图像。组按从左到右的路径运行:模型、提示、输入、参考条件和采样器。
模型
- 此组使用
UNETLoader(#126)、CLIPLoader(#133) 和VAELoader(#127) 加载扩散骨干、文本编码器和 VAE。 FluxKVCache(#139) 包装加载的模型以启用键值缓存,因此重复运行更快,这在优化相同提示或种子时很有帮助。- 这里不需要用户输入;模型已为 Flux 2 Klein 9B KV 图像编辑工作流程预选。
提示
- 在
CLIP Text Encode (Positive Prompt)(#135) 中输入您的指令。写下要更改的内容和要保留的内容,例如:“将主体置于第二套服装中,并将背景更改为非洲大草原。” - 正提示驱动编辑;通过
ConditioningZeroOut(#685) 创建中和的负信号,以便参考指导和您的指令保持重点。 - 保持提示简洁具体,以减少意外的全局更改。
输入
- 使用
LoadImage(#76) 加载您的主要主体图像。可选地,使用LoadImage(#81) 加载次要参考,如服装、风格或纹理。 - 每个参考通过
ImageScaleToTotalPixels(#130, #131) 以标准化分辨率并保持内存使用可预测。 - 使用高质量、光线充足的输入以获得最强的身份和风格转移。
参考条件
- 子图
Reference Conditioning(#134) 使用VAE编码主要图像,并将其潜在特征混合到正负条件中。这在允许目标编辑的同时保留身份、姿势和构图。 - 第二个
Reference Conditioning(#132) 层从可选的参考图像(例如,服装或风格)中注入指导,因此编辑在不破坏主体的情况下传递细节。 - 您可以通过重复此模式来链接其他参考,遵循画布中的“更多参考图像”注释。
采样器
Flux2Scheduler(#137) 准备去噪计划和分辨率,而GetImageSize(#128) 将宽度和高度同步到您的标准化输入。KSamplerSelect(#122) 选择采样算法,SamplerCustomAdvanced(#123) 使用RandomNoise(#125) 进行去噪的种子和CFGGuider(#138) 进行提示和参考指导。- 最终潜变量由
VAEDecode(#124) 解码并由SaveImage(#94) 写入。
Comfyui Flux 2 Klein 9B KV 图像编辑工作流程中的关键节点
CLIP Text Encode (Positive Prompt) (#135)
- 将您的指令转换为引导编辑的嵌入。偏好明确的动词和目标(“替换背景为……”,“应用第二张图像中的服装……”)并提及必须保持不变的内容(“保持姿势和表情”)。该节点是语义控制的主要杠杆。
Reference Conditioning (#134)
- 编码主要参考图像并将其潜在特征注入条件流中。使用此功能锁定身份、构图和姿势,使 Flux 2 Klein 9B KV 图像编辑在应用您请求的更改时保持忠实。
Reference Conditioning (#132)
- 添加来自第二个参考图像的指导,理想用于传递服装、材料或风格线索。将定义细节的图像放在此处,以便在不压倒主体的情况下进行本地化编辑。
CFGGuider (#138)
- 平衡模型遵循提示和参考条件的强度。如果编辑太弱,请稍微增加指导;如果主体漂移或出现伪影,请减少它以让参考锚定输出。
Flux2Scheduler (#137)
- 设置去噪计划并协调分辨率与您的参考。与
GetImageSize(#128) 配对,它保持画布与输入对齐,以便保持框架和纵横比。
KSamplerSelect (#122)
- 选择
SamplerCustomAdvanced(#123) 使用的采样器。如果您想要不同的噪声探索行为,请尝试替代采样器;在比较结果时保持其他设置稳定。
FluxKVCache (#139)
- 启用模型上的键值缓存,以便在相似上下文下进行更快的后续运行。当您在相同提示或种子上进行迭代并希望快速 A/B 比较时特别有用。
ConditioningZeroOut (#685)
- 生成中性负条件基线。仅当您有特定内容要避免时才用您自己的负提示路径替换它;否则默认设置保持编辑稳定和专注。
可选附加项
- 从字面上、逐步指令开始。示例结构:“保持人物不变,应用第二张图像中的服装,将背景替换为[目标场景],保持姿势和光照。”
- 使用高质量的参考来获得身份和风格。裁剪、整洁的主体改善转移。
- 对于受控变体,更改
RandomNoise(#125) 中的种子,同时保持提示和参考不变。 - 要添加更多参考,请复制
ImageScaleToTotalPixels和Reference Conditioning模式,将每个新图像连接到链中。 - 通过调整
SaveImage(#94) 中的基本文件名组织输出,以保持迭代整洁。
致谢
此工作流程实现并基于以下作品和资源构建。我们感谢 Black Forest Labs 提供的 FLUX.2 Klein 9B KV FP8,Comfy-Org 提供的 Qwen 3 8B 文本编码器(flux2-klein-9B)和 FLUX.2 VAE,以及 Comfy.org 的官方工作流程的贡献和维护。有关权威详细信息,请参阅以下链接的原始文档和存储库。
资源
- Black Forest Labs/FLUX.2 Klein 9B KV FP8
- GitHub: black-forest-labs/flux2
- Hugging Face: black-forest-labs/FLUX.2-klein-9b-kv-fp8
- Comfy-Org/Qwen 3 8B Text Encoder (flux2-klein-9B)
- Hugging Face: Comfy-Org/flux2-klein-9B
- Comfy-Org/FLUX.2 VAE
- Hugging Face: Comfy-Org/flux2-dev
- Comfy.org/Official Workflow
- 文档/发布说明: Flux.2 Klein KV: 图像编辑 - ComfyUI 工作流程
注意:所引用的模型、数据集和代码的使用受其作者和维护者提供的各自许可证和条款限制。
