logo
RunComfy
  • ComfyUI
  • TrainerNew
  • Models
  • API
  • Pricing
discord logo
ComfyUI>工作流>PixelSmile 精细表情编辑 | 精准面部控制

PixelSmile 精细表情编辑 | 精准面部控制

Workflow Name: RunComfy/PixelSmile-fine-grained-expression-control
Workflow ID: 0000...1390
通过此工作流程,您可以精细调整面部微妙的情感,同时保持肖像的高视觉保真度。设计师可以轻松地将表情从快乐转向平静或惊讶,而不改变原始构图。基于 Qwen Image Edit,它使用 PixelSmile 条件方法确保一致的结果。非常适合情感修饰、角色设计或数字肖像增强。完美适合那些对情感呈现要求精确和细致的创作者。

使用 PixelSmile 精细表情控制进行精确的肖像编辑

此 ComfyUI 工作流程在 Qwen Image Edit 的基础上提供 PixelSmile 精细表情控制。它使您可以将面部从中性转变为特定情感,并在保持身份和构图完整的同时在它们之间进行混合。典型的用例包括头像的细微修饰、探索角色的情感变化,以及在单个画布中制作受控的表情混合。

在后台,图形使用 Qwen 的编辑编码器对中性和目标提示进行编码,计算 PixelSmile 差异以隔离表情变化,混合多个目标,然后使用轻量级 Lightning LoRA 进行采样以获得快速、一致的结果。您可以对快乐、惊讶、中性或任何其他可提示的表情进行可预测的控制,而无需重组场景。

Comfyui PixelSmile 精细表情控制工作流程中的关键模型

  • Qwen-Image-Edit-2511。基于扩散的图像编辑基础,在编辑过程中保留布局和身份。它扩展了 Qwen-Image 以进行结构感知的局部修改和稳定的文本条件变化。模型卡
  • Qwen2.5-VL-7B-Instruct。此处用作提示编码器的文本视觉模型,从简短的自然短语中生成强大的编辑条件。模型卡
  • PixelSmile LoRA。专注于表情的 LoRA,提供线性、强度控制的面部变化,与提示语义保持一致。查看开源权重和项目资源。Hugging Face 论文
  • Qwen-Image-Edit-2511-Lightning LoRA。速度优化的 LoRA,可在很少的步骤中实现高质量编辑,非常适合交互式表情探索。模型卡

如何使用 Comfyui PixelSmile 精细表情控制工作流程

此流程采用源肖像,构建中性和目标表情条件,计算 PixelSmile 差异,混合多个目标,然后采样并解码结果。在编码器节点中编辑提示,调整 PixelSmile 强度和混合,并预览输出。

加载源肖像并设置工作尺寸

  • 使用 LoadImage (#129) 导入您的肖像。图像同时提供给编码器和尺寸探测器,因此图形可以在原始分辨率下渲染。
  • GetImageSize+ (#257) 读取宽度和高度,EmptySD3LatentImage (#119) 分配相同大小的潜在图像。这在采样过程中保持框架和构图稳定。

描述中性和目标表情

  • TextEncodeQwenImageEditPlus (#248) 编码与源图像配对的中性描述(例如“中性表情”)。这成为您的参考状态。
  • 在 TextEncodeQwenImageEditPlus (#113, #260) 中创建一个或多个目标描述,例如“快乐表情”或“惊讶表情”。每个目标使用相同的源图像,锚定身份和姿势。
  • 提示可以是简短而自然的。编码器使用 Qwen2.5-VL-7B-Instruct 为 Qwen-Image-Edit-2511 派生编辑条件。

计算 PixelSmile 差异以进行精确控制

  • 对于每个目标,PixelSmileConditioning (#249, #259) 接受目标条件和中性条件,然后计算一个仅隔离面部表情变化的差异。
  • 节点公开一个强度控制,线性缩放表情强度。它还支持一种令牌范围方法,将插值限制在表情词上,这有助于避免面部区域以外的意外变化。

混合多个表情

  • ConditioningAverage (#261) 将两个 PixelSmile 输出混合为一个正向条件。使用它来混合,例如,40% 的惊讶与 60% 的快乐,以获得复合情感。
  • ConditioningZeroOut (#231) 通过消除残余引导提供干净的负向。这使编辑集中并减少漂移。

使用 Qwen Image Edit 和 Lightning 进行采样

  • 模型堆栈加载 Qwen-Image-Edit-2511 UNet,应用 PixelSmile LoRA,然后层叠 Lightning LoRA 以实现快速、一致的步骤(UNETLoader (#244) → LoraLoaderModelOnly (#250, #251) → ModelSamplingAuraFlow (#118))。
  • KSampler (#133) 使用混合的正向和消除的负向条件执行去噪。Lightning LoRA 允许在少量步骤中进行响应的预览,这在调整 PixelSmile 强度和混合时非常理想。

解码和预览

  • VAEDecode (#120) 将最终潜在图像转换回图像,PreviewImage (#134) 显示结果。由于潜在图像的大小与源图像匹配,输出保持构图和纵横比。

Comfyui PixelSmile 精细表情控制工作流程中的关键节点

PixelSmileConditioning (#249)

计算目标提示与中性基线之间的表情差异,然后缩放以控制强度。调整 score 以增加或减弱表情变化。method 切换允许您跨所有令牌插值以进行更广泛的风格变化,或将插值限制在表情令牌上以进行更严格的面部控制,这通常更忠实地保留头发和背景。请参阅节点实现以了解详细信息。GitHub

PixelSmileConditioning (#259)

第二个实例,针对相同的中性基线启用并行目标(例如“惊讶”)。使用此设置 A/B 表情轨道以进行混合。如果计划混合,请保持两个 PixelSmile score 值适中,因为两个轨道上的极端设置可能会抵消或过度驱动结果。

ConditioningAverage (#261)

将两个 PixelSmile 条件混合为一个正向条件。增加权重以使您希望主导的表情占主导地位,或者完全设置为一侧以进行纯单一表情运行。在构建细微情感时,从接近平分开始,然后通过小增量调整偏向,直到眉毛和嘴角等微观特征看起来自然。

TextEncodeQwenImageEditPlus (#113)

通过简短提示和输入图像生成编辑条件,利用 Qwen2.5-VL-7B-Instruct 作为 Qwen-Image-Edit-2511 的编码器。保持措辞简洁且特定于情感。在中性和目标编码器中将相同的源图像配对是身份保留的关键。

KSampler (#133)

使用堆叠的 Qwen-Image-Edit 骨干和 Lightning LoRA 运行去噪。主要用于控制整体迭代次数和可变性,同时微调 PixelSmile 强度和混合。如果出现伪影,请先减少 PixelSmile score,然后再增加步骤。

可选附加功能

  • 保持表情词明确,例如“微妙的快乐表情”或“轻微惊讶”,以使 PixelSmile 差异偏向微表情。
  • 如果面部变化渗入头发或背景,请将 PixelSmile method 切换为令牌限制的插值并稍微减少 score。
  • 在编辑之前松散地裁剪面部,如果表情感觉不够强烈,然后在找到喜欢的设置后重新应用于完整图像。
  • 为了加快预览速度,请使用 Lightning LoRA 和低步数进行迭代,然后仅在需要时为最终导出提高步数。

参考模型和项目资源链接:

  • PixelSmile 项目和权重:Hugging Face 和论文 PixelSmile: Toward Fine-Grained Facial Expression Editing
  • PixelSmile ComfyUI 节点:GitHub
  • Qwen-Image-Edit-2511:Hugging Face
  • Qwen2.5-VL-7B-Instruct:Hugging Face
  • Qwen-Image-Edit-2511-Lightning:Hugging Face

致谢

此工作流程实现并基于以下作品和资源。我们感激地承认 r/StableDiffusion 社区的源帖子,PixelSmile 提供的 PixelSmile 模型,以及 judian17 提供的 ComfyUI PixelSmile Conditioning Interpolation 节点的贡献和维护。有关权威细节,请参阅下文链接的原始文档和存储库。

资源

  • r/StableDiffusion/源帖子
    • 文档/发布说明:Reddit post
  • PixelSmile/PixelSmile
    • Hugging Face: PixelSmile/PixelSmile
  • judian17/ComfyUI-PixelSmile-Conditioning-Interpolation
    • GitHub: judian17/ComfyUI-PixelSmile-Conditioning-Interpolation

注意:引用的模型、数据集和代码的使用受其作者和维护者提供的各自许可证和条款的约束。

Want More ComfyUI Workflows?

Flux 2 Klein 9B KV 图像编辑 | 智能图像变换器

基于提示的图像编辑,保持结构和身份不变。

FireRed 图像编辑 1.1 | 智能照片变压器

通过超详细、基于提示的精确度快速编辑照片。

Qwen Image Edit 2511 | 智能图像编辑工作流程

根据您的指示快速且精确地编辑您的图像。

LTX-2 ComfyUI | 实时视频生成器

即时创建实时视频,比任何其他生成器都快。

插入任何内容 | 基于参考的图像编辑

通过蒙版或文本指导将任何主题插入图像。

FLUX Kontext Preset | 场景控制

通过精心策划的一键式 AI 预设掌握场景创建。

OmniGen | 图像到图像

OmniGen:根据参考图像和提示修改图像

混元 LoRA

使用下载的混元 LoRA 来控制视频生成中的风格和角色一致性。

关注我们
  • 领英
  • Facebook
  • Instagram
  • Twitter
支持
  • Discord
  • 电子邮件
  • 系统状态
  • 附属
资源
  • 免费 ComfyUI 在线版
  • ComfyUI 指南
  • RunComfy API
  • ComfyUI 教程
  • ComfyUI 节点
  • 了解更多
法律
  • 服务条款
  • 隐私政策
  • Cookie 政策
RunComfy
版权 2026 RunComfy. 保留所有权利。

RunComfy 是首选的 ComfyUI 平台,提供 ComfyUI 在线 环境和服务,以及 ComfyUI 工作流 具有惊艳的视觉效果。 RunComfy还提供 AI Models, 帮助艺术家利用最新的AI工具创作出令人惊叹的艺术作品。