PixelSmile 在 ComfyUI 中的精细表情控制

ComfyUI PixelSmile fine-grained expression control 工作流程

PixelSmile Fine-Grained Expression Control in ComfyUI | Precise Facial Editing

想要运行这个工作流吗？

完全可操作的工作流
没有缺失的节点或模型
无需手动设置
具有惊艳的视觉效果

ComfyUI PixelSmile fine-grained expression control 示例

pixelsmile-fine-grained-expression-control-in-comfyui-precise-facial-editing-1390-example_01.webp

pixelsmile-fine-grained-expression-control-in-comfyui-precise-facial-editing-1390-example_02.webp

pixelsmile-fine-grained-expression-control-in-comfyui-precise-facial-editing-1390-example_03.webp

pixelsmile-fine-grained-expression-control-in-comfyui-precise-facial-editing-1390-example_04.webp

pixelsmile-fine-grained-expression-control-in-comfyui-precise-facial-editing-1390-example_05.webp

pixelsmile-fine-grained-expression-control-in-comfyui-precise-facial-editing-1390-example_06.webp

使用 PixelSmile 精细表情控制进行精确的肖像编辑#

此 ComfyUI 工作流程在 Qwen Image Edit 的基础上提供 PixelSmile 精细表情控制。它使您可以将面部从中性转变为特定情感，并在保持身份和构图完整的同时在它们之间进行混合。典型的用例包括头像的细微修饰、探索角色的情感变化，以及在单个画布中制作受控的表情混合。

在后台，图形使用 Qwen 的编辑编码器对中性和目标提示进行编码，计算 PixelSmile 差异以隔离表情变化，混合多个目标，然后使用轻量级 Lightning LoRA 进行采样以获得快速、一致的结果。您可以对快乐、惊讶、中性或任何其他可提示的表情进行可预测的控制，而无需重组场景。

Comfyui PixelSmile 精细表情控制工作流程中的关键模型#

Qwen-Image-Edit-2511。基于扩散的图像编辑基础，在编辑过程中保留布局和身份。它扩展了 Qwen-Image 以进行结构感知的局部修改和稳定的文本条件变化。模型卡
Qwen2.5-VL-7B-Instruct。此处用作提示编码器的文本视觉模型，从简短的自然短语中生成强大的编辑条件。模型卡
PixelSmile LoRA。专注于表情的 LoRA，提供线性、强度控制的面部变化，与提示语义保持一致。查看开源权重和项目资源。Hugging Face 论文
Qwen-Image-Edit-2511-Lightning LoRA。速度优化的 LoRA，可在很少的步骤中实现高质量编辑，非常适合交互式表情探索。模型卡

如何使用 Comfyui PixelSmile 精细表情控制工作流程#

此流程采用源肖像，构建中性和目标表情条件，计算 PixelSmile 差异，混合多个目标，然后采样并解码结果。在编码器节点中编辑提示，调整 PixelSmile 强度和混合，并预览输出。

加载源肖像并设置工作尺寸#

使用 LoadImage (#129) 导入您的肖像。图像同时提供给编码器和尺寸探测器，因此图形可以在原始分辨率下渲染。
GetImageSize+ (#257) 读取宽度和高度，EmptySD3LatentImage (#119) 分配相同大小的潜在图像。这在采样过程中保持框架和构图稳定。

描述中性和目标表情#

TextEncodeQwenImageEditPlus (#248) 编码与源图像配对的中性描述（例如“中性表情”）。这成为您的参考状态。
在 TextEncodeQwenImageEditPlus (#113, #260) 中创建一个或多个目标描述，例如“快乐表情”或“惊讶表情”。每个目标使用相同的源图像，锚定身份和姿势。
提示可以是简短而自然的。编码器使用 Qwen2.5-VL-7B-Instruct 为 Qwen-Image-Edit-2511 派生编辑条件。

计算 PixelSmile 差异以进行精确控制#

对于每个目标，PixelSmileConditioning (#249, #259) 接受目标条件和中性条件，然后计算一个仅隔离面部表情变化的差异。
节点公开一个强度控制，线性缩放表情强度。它还支持一种令牌范围方法，将插值限制在表情词上，这有助于避免面部区域以外的意外变化。

混合多个表情#

ConditioningAverage (#261) 将两个 PixelSmile 输出混合为一个正向条件。使用它来混合，例如，40% 的惊讶与 60% 的快乐，以获得复合情感。
ConditioningZeroOut (#231) 通过消除残余引导提供干净的负向。这使编辑集中并减少漂移。

使用 Qwen Image Edit 和 Lightning 进行采样#

模型堆栈加载 Qwen-Image-Edit-2511 UNet，应用 PixelSmile LoRA，然后层叠 Lightning LoRA 以实现快速、一致的步骤（UNETLoader (#244) → LoraLoaderModelOnly (#250, #251) → ModelSamplingAuraFlow (#118)）。
KSampler (#133) 使用混合的正向和消除的负向条件执行去噪。Lightning LoRA 允许在少量步骤中进行响应的预览，这在调整 PixelSmile 强度和混合时非常理想。

解码和预览#

VAEDecode (#120) 将最终潜在图像转换回图像，PreviewImage (#134) 显示结果。由于潜在图像的大小与源图像匹配，输出保持构图和纵横比。

Comfyui PixelSmile 精细表情控制工作流程中的关键节点#

`PixelSmileConditioning` (#249)#

计算目标提示与中性基线之间的表情差异，然后缩放以控制强度。调整 score 以增加或减弱表情变化。method 切换允许您跨所有令牌插值以进行更广泛的风格变化，或将插值限制在表情令牌上以进行更严格的面部控制，这通常更忠实地保留头发和背景。请参阅节点实现以了解详细信息。GitHub

`PixelSmileConditioning` (#259)#

第二个实例，针对相同的中性基线启用并行目标（例如“惊讶”）。使用此设置 A/B 表情轨道以进行混合。如果计划混合，请保持两个 PixelSmile score 值适中，因为两个轨道上的极端设置可能会抵消或过度驱动结果。

`ConditioningAverage` (#261)#

将两个 PixelSmile 条件混合为一个正向条件。增加权重以使您希望主导的表情占主导地位，或者完全设置为一侧以进行纯单一表情运行。在构建细微情感时，从接近平分开始，然后通过小增量调整偏向，直到眉毛和嘴角等微观特征看起来自然。

`TextEncodeQwenImageEditPlus` (#113)#

通过简短提示和输入图像生成编辑条件，利用 Qwen2.5-VL-7B-Instruct 作为 Qwen-Image-Edit-2511 的编码器。保持措辞简洁且特定于情感。在中性和目标编码器中将相同的源图像配对是身份保留的关键。

`KSampler` (#133)#

使用堆叠的 Qwen-Image-Edit 骨干和 Lightning LoRA 运行去噪。主要用于控制整体迭代次数和可变性，同时微调 PixelSmile 强度和混合。如果出现伪影，请先减少 PixelSmile score，然后再增加步骤。

可选附加功能#

保持表情词明确，例如“微妙的快乐表情”或“轻微惊讶”，以使 PixelSmile 差异偏向微表情。
如果面部变化渗入头发或背景，请将 PixelSmile method 切换为令牌限制的插值并稍微减少 score。
在编辑之前松散地裁剪面部，如果表情感觉不够强烈，然后在找到喜欢的设置后重新应用于完整图像。
为了加快预览速度，请使用 Lightning LoRA 和低步数进行迭代，然后仅在需要时为最终导出提高步数。

参考模型和项目资源链接：

PixelSmile 项目和权重：Hugging Face 和论文 PixelSmile: Toward Fine-Grained Facial Expression Editing
PixelSmile ComfyUI 节点：GitHub
Qwen-Image-Edit-2511：Hugging Face
Qwen2.5-VL-7B-Instruct：Hugging Face
Qwen-Image-Edit-2511-Lightning：Hugging Face

致谢#

此工作流程实现并基于以下作品和资源。我们感激地承认 r/StableDiffusion 社区的源帖子，PixelSmile 提供的 PixelSmile 模型，以及 judian17 提供的 ComfyUI PixelSmile Conditioning Interpolation 节点的贡献和维护。有关权威细节，请参阅下文链接的原始文档和存储库。

资源#

r/StableDiffusion/源帖子
- 文档/发布说明：Reddit post
PixelSmile/PixelSmile
- Hugging Face: PixelSmile/PixelSmile
judian17/ComfyUI-PixelSmile-Conditioning-Interpolation
- GitHub: judian17/ComfyUI-PixelSmile-Conditioning-Interpolation

注意：引用的模型、数据集和代码的使用受其作者和维护者提供的各自许可证和条款的约束。

Want More ComfyUI Workflows?

Flux 2 Klein 9B KV 图像编辑 | 智能图像变换器

基于提示的图像编辑，保持结构和身份不变。

FireRed 图像编辑 1.1 | 智能照片变压器

通过超详细、基于提示的精确度快速编辑照片。

Qwen Image Edit 2511 | 智能图像编辑工作流程

根据您的指示快速且精确地编辑您的图像。

Woosh音效生成 | Text2Audio + VideoSync

将提示和视频转换为清晰同步的音频效果。

动态图形动画效果 | Vid2Vid

从预先存在的视频输入开始实现动态图形动画效果。

SkyReels V1 | 人物为中心的视频创作

从文本或图像生成具有真实面部表情和自然动作的电影级人物视频。

AP Workflow 12.0 | 即用型完整AI媒体套件

预设的一体化系统，用于图像和视频生成、增强和操作。无需设置。

EchoMimic | 音频驱动的人像动画

生成与提供的音频同步的逼真说话头像和身体动作。

关注我们

支持

资源

法律

RunComfy

RunComfy 是首选的 ComfyUI 平台，提供 ComfyUI 在线环境和服务，以及 ComfyUI 工作流具有惊艳的视觉效果。 RunComfy还提供 AI Models, 帮助艺术家利用最新的AI工具创作出令人惊叹的艺术作品。

PixelSmile 精细表情编辑 | 精准面部控制