此工作流程将 Z-Image-Turbo 和一组旋转的 Z-Image 精调模型组合成一个单一的、生产就绪的 ComfyUI 图形。其设计目的是并排比较风格,保持提示行为一致,并在最少步骤内产生清晰、连贯的结果。它结合了优化的 UNet 加载、CFG 归一化、AuraFlow 兼容采样和可选的 LoRA 注入,因此您可以探索现实主义、电影肖像、暗黑幻想和动漫风格外观,而无需重新连接画布。
Z-Image 精调模型非常适合希望快速评估多个检查点和 LoRA 的艺术家、提示工程师和模型探索者,同时保持在一个一致的管道内。输入一个提示,从不同的 Z-Image 精调模型中渲染四种变体,并快速锁定最符合您要求的风格。
Tongyi-MAI Z-Image-Turbo。一个 6B 参数的单流扩散变换器,经过蒸馏以实现少步、逼真的文本到图像转换,具有强大的指令遵从性和双语文本渲染。官方权重和使用说明在模型卡上,技术报告和蒸馏方法详见 arXiv 和项目仓库。Model • Paper • Decoupled-DMD • DMDR • GitHub • Diffusers pipeline
BEYOND REALITY Z-Image(社区精调)。一个倾向于真实感的 Z-Image 检查点,强调光泽纹理、清晰边缘和风格化的完成,适合肖像和产品类构图。Model
Z-Image-Turbo-Realism LoRA(此工作流程的 LoRA 通道中的示例 LoRA)。一个轻量级的适配器,推动超现实渲染,同时保持基础 Z-Image-Turbo 提示对齐;无需替换基础模型即可加载。Model
AuraFlow 家族(采样兼容参考)。工作流程使用 AuraFlow 风格的采样钩子进行稳定的少步生成;有关 AuraFlow 调度器及其设计目标的背景,请参见管道参考。Docs
该图形组织为四个独立的生成通道,共享一个公共文本编码器和 VAE。使用一个提示来驱动所有通道,然后比较从每个分支保存的结果。
通用模型
CLIPTextEncode (#75) 中输入您的描述,并在负面 CLIPTextEncode (#74) 中添加可选约束。这确保了各分支间的条件相同,以便您可以公平地判断每个精调模型的表现。VAELoader (#21) 提供了所有通道用于将潜在变量转回图像的解码器。Z-Image(基础 Turbo)
UNETLoader (#100) 运行官方 Z-Image-Turbo UNet,并通过 ModelSamplingAuraFlow (#76) 为少步稳定性打补丁。CFGNorm (#67) 标准化无分类指导行为,以便采样器的对比度和细节在提示间保持可预测性。一个 EmptyLatentImage (#19) 定义了画布大小,然后 KSampler (#78) 生成潜在变量,这些变量由 VAEDecode (#79) 解码并由 SaveImage (#102) 写入。使用此分支作为评估其他 Z-Image 精调模型时的基线。Z-Image-Turbo + Realism LoRA
UNETLoader (#82) 之上通过 LoraLoaderModelOnly (#106) 注入风格适配器。ModelSamplingAuraFlow (#84) 和 CFGNorm (#64) 保持输出清晰,同时 LoRA 推动现实主义而不压倒主题。使用 EmptyLatentImage (#71) 定义分辨率,用 KSampler (#85) 生成,通过 VAEDecode (#86) 解码,并使用 SaveImage (#103) 保存。如果 LoRA 感觉太强,可以在此处减轻其权重,而不是过度编辑您的提示。BEYOND REALITY 精调
UNETLoader (#88) 引入一个社区检查点,以提供风格化的高对比度外观。CFGNorm (#66) 驯服指导,使视觉签名在更改采样器或步骤时保持清晰。设置目标大小在 EmptyLatentImage (#72),用 KSampler (#89) 渲染,通过 VAEDecode (#90) 解码,并通过 SaveImage (#104) 保存。使用与基础通道相同的提示,查看此精调如何解释构图和照明。Red Tide Dark Beast AIO 精调
CheckpointLoaderSimple (#92) 加载,然后由 CFGNorm (#65) 归一化。此通道倾向于阴郁的色调和更重的微对比,同时保持良好的提示合规性。选择您的框架在 EmptyLatentImage (#73),用 KSampler (#93) 生成,通过 VAEDecode (#94) 解码,并从 SaveImage (#105) 导出。这是一种在相同 Z-Image 精调模型设置中测试更粗犷美学的实用方法。ModelSamplingAuraFlow (#76, #84)
shift 控件微调采样轨迹;将其视为一个微调拨盘,与您的采样器选择和步数预算互动。为了在各通道之间获得最佳可比性,保持相同的采样器,仅在每次测试中调整一个变量(例如,shift 或 LoRA 权重)。参考:AuraFlow 管道背景和调度说明。DocsCFGNorm (#64, #65, #66, #67)
strength;如果图像开始看起来过于压缩,则减少它。当您想要对 Z-Image 精调模型进行干净的 A/B 测试时,请在各分支之间保持相似。LoraLoaderModelOnly (#106)
strength 参数控制风格影响;较低的值保留基础现实主义,而较高的值则施加 LoRA 的外观。如果 LoRA 力压面部或排版,首先减少其权重,然后微调提示措辞。KSampler (#78, #85, #89, #93)
shift 以隔离原因和效果。SaveImage 节点各自标记,以便您可以快速比较和策展。进一步阅读的链接:
此工作流程实现并建立在以下作品和资源的基础上。我们对 HuggingFace 模型为本文的贡献和维护表示衷心感谢。有关权威详细信息,请参考下文链接的原始文档和存储库。
注意:所引用的模型、数据集和代码的使用受其作者和维护者提供的相应许可证和条款的约束。
RunComfy 是首选的 ComfyUI 平台,提供 ComfyUI 在线 环境和服务,以及 ComfyUI 工作流 具有惊艳的视觉效果。 RunComfy还提供 AI Models, 帮助艺术家利用最新的AI工具创作出令人惊叹的艺术作品。