此工作流使用Hunyuan Image 2.1将您的提示转化为清晰的原生2048×2048渲染。它将腾讯的扩散变换器与双文本编码器结合,以提升语义对齐和文本渲染质量,然后高效采样并通过匹配的高压缩VAE解码。如果您需要生产就绪的场景、角色和图像中的清晰文本,同时保持速度和控制,这个ComfyUI Hunyuan Image 2.1工作流就是为您而建。
创作者、艺术总监和技术艺术家可以插入多语言提示,微调几个旋钮,并始终获得清晰的结果。图形附带合理的负面提示、原生2K画布和FP8 UNet以控制VRAM,展示Hunyuan Image 2.1开箱即用的能力。
图形从提示到像素遵循清晰的路径:使用两个编码器编码文本,准备原生2K潜在画布,使用Hunyuan Image 2.1采样,通过匹配的VAE解码并保存输出。
DualCLIPLoader
(#33) 加载配置为Hunyuan Image 2.1的Qwen2.5‑VL‑7B和ByT5 Small。这种双重设置使模型可以解析场景语义,同时对字形和多语言文本保持强大。CLIPTextEncode
(#6)中输入您的主要描述。您可以用英语或中文书写,混合相机提示和照明,并包含图像中的文本指示。CLIPTextEncode
(#7)中使用现成的负面提示抑制常见的伪影。您可以根据自己的风格调整它,或者保持原样以获得平衡的结果。EmptyHunyuanImageLatent
(#29) 使用单批次在2048×2048初始化画布。Hunyuan Image 2.1专为2K生成而设计,因此建议使用原生2K尺寸以获得最佳质量。UNETLoader
(#37) 加载FP8检查点以减少VRAM,同时保持保真度,然后将其馈送给KSampler
(#3)进行去噪。VAELoader
(#34) 引入Hunyuan Image 2.1 VAE,VAEDecode
(#8) 使用模型的32×压缩方案从采样的潜在中重建最终图像。SaveImage
(#9) 将输出写入您选择的目录。如果您计划跨种子或提示进行迭代,请设置清晰的文件名前缀。DualCLIPLoader
(#33)此节点加载Hunyuan Image 2.1预期的文本编码器对。保持模型类型设置为Hunyuan,并选择Qwen2.5‑VL‑7B和ByT5 Small,以结合强大的场景理解和字形感知的文本处理。如果您在风格上进行迭代,请调整正面提示与指导同步,而不是更换编码器。
CLIPTextEncode
(#6和#7)这些节点将您的正面和负面提示转化为条件。保持正面提示简洁在上方,然后添加镜头、照明和风格提示。使用负面提示抑制诸如多余肢体或噪声文本等伪影;如果您认为它对您的概念过于限制,请修剪它。
EmptyHunyuanImageLatent
(#29)定义工作分辨率和批次。默认的2048×2048与Hunyuan Image 2.1的原生2K能力对齐。对于其他长宽比,请选择对模型友好的宽度和高度对,并考虑在您远离方形时稍微增加步骤。
KSampler
(#3)驱动Hunyuan Image 2.1的去噪过程。当您需要更精细的微观细节时增加步骤,快速草稿时减少。提高指导以更强的提示遵循,但注意过饱和或刚性;降低以获得更自然的变化。切换种子以探索构图,而无需更改您的提示。
UNETLoader
(#37)加载Hunyuan Image 2.1 UNet。包含的FP8检查点保持2K输出的内存使用适中。如果您有充足的VRAM并希望最大限度地提供激进设置的空间,请考虑从官方发布中选择同一模型的更高精度变体。
VAELoader
(#34) 和 VAEDecode
(#8)这些节点必须与Hunyuan Image 2.1版本匹配才能正确解码。模型的高压缩VAE是快速2K生成的关键;配对正确的VAE可以避免颜色偏移和块状纹理。如果您更改基础模型,请务必相应更新VAE。
此工作流实现并建立在以下作品和资源之上。我们感谢@Ai Verse和Hunyuan为Hunyuan Image 2.1 Demo的贡献和维护。有关权威详情,请参阅下面链接的原始文档和存储库。
注意:使用所引用的模型、数据集和代码需遵守其作者和维护者提供的各自许可和条款。
RunComfy 是首选的 ComfyUI 平台,提供 ComfyUI 在线 环境和服务,以及 ComfyUI 工作流 具有惊艳的视觉效果。 RunComfy还提供 AI Playground, 帮助艺术家利用最新的AI工具创作出令人惊叹的艺术作品。