logo
RunComfy
ComfyUIPlaygroundPricing
discord logo
ComfyUI>工作流>ComfyUI PhotoMakerV2 | 创建逼真的照片

ComfyUI PhotoMakerV2 | 创建逼真的照片

Workflow Name: RunComfy/PhotoMakerV2
Workflow ID: 0000...1109
ComfyUI PhotoMakerV2是一款强大的文本到图像生成工具,使用户能够高效地创建逼真的个性化照片。通过输入身份图像和文本提示,PhotoMakerV2在保留个人相貌的同时,允许灵活控制背景、风格和属性。这个最新版本相比其前身提供了更好的身份保真度。探索在不同场景中生成逼真图像的创意可能性,风格化外观,甚至合并身份。

什么是PhotoMakerV2

PhotoMakerV2是PhotoMaker的升级版,提供了一种高效的个性化文本到图像生成方法。它使用少量输入身份图像和文本提示合成逼真的个人照片。

PhotoMakerV2的一些主要特点包括:

  • 高效:快速生成个性化照片。
  • 优秀的身份保留:保持输入身份的相貌。
  • 灵活的文本控制:允许在提示中指定背景、风格、属性等。
  • 改进的身份保真度:相比PhotoMaker V1有所增强。 PhotoMakerV2在各种背景下生成逼真的个人图像,风格化外观,改变年龄和性别等属性,合并身份,并将旧照片或艺术作品中的人物现代化。它解锁了无数的创意可能性。

PhotoMakerV2的工作原理

PhotoMakerV2将一个或多个输入身份图像编码为"堆叠ID嵌入",作为封装身份信息的统一表示。

这个嵌入与文本提示结合,输入到文本到图像扩散模型中。然后模型生成一张图像,展示嵌入身份在提示描述的背景下。

其工作原理的一些关键方面:

  • 使用身份编码器从输入的面部图像中提取身份信息
  • 通过利用外部面部识别模型(InsightFace)改进身份保留
  • 将多个身份图像编码为堆叠嵌入,以全面捕捉身份
  • 将堆叠ID嵌入输入到扩散模型的交叉注意力层中
  • 在文本提示的指导下,自适应地合并身份信息
  • 使用面向身份的数据集进行训练,以提高识别能力

如何使用ComfyUI PhotoMakerV2

要在ComfyUI中使用PhotoMakerV2,主要与PhotoMakerEncodePlus节点交互。典型的工作流程包括:

  1. 使用"PhotoMaker Loader Plus"节点加载PhotoMakerV2模型。
  2. 使用"Prepare Images For CLIP Vision"节点加载一个或多个身份图像。
  3. 使用"PhotoMaker InsightFace Loader"节点加载PhotoMakerV2所需的InsightFace模型。
  4. 将这些节点的输出连接到"PhotoMaker Encode Plus"节点的对应输入。
  5. 在"PhotoMaker Encode Plus"节点中指定描述所需图像的提示。使用提示中特殊的触发词指示身份出现的位置。
  6. 将"PhotoMaker Encode Plus"的输出条件连接到"KSampler"节点以生成图像。

更多信息,请访问PhotoMaker Hugging Face和ComfyUI-PhotoMaker-Plus。所有功劳归于他们的贡献。

Want More ComfyUI Workflows?

ControlNet Tile + 4x UltraSharp | 图像/视频升频器

使用ControlNet Tile、4xUltraSharp和帧插值来获得高分辨率结果。

Qwen Image Edit 2509 | 多图像编辑器

将 2–3 张图片瞬间变成无缝编辑的杰作。

AP Workflow 12.0 | 即用型完整AI媒体套件

预设的一体化系统,用于图像和视频生成、增强和操作。无需设置。

AnimateDiff + QR Code ControlNet | 视觉效果(VFX)

使用 AnimateDiff 和 ControlNet(包括 QRCode Monster 和 Lineart)创建引人入胜的视觉效果。

ACE++ 面部替换 | 图像编辑

使用自然语言指令替换图像中的面部,同时保留风格和上下文。

CogvideoX Fun | 视频到视频模型

CogVideoX Fun: 高级视频到视频模型,用于高质量视频生成。

SUPIR + Foolhardy Remacri | 8K 图像/视频放大器

SUPIR + Foolhardy Remacri | 8K 图像/视频放大器

使用 SUPIR 和 4 倍 Foolhardy Remacri 模型将图像放大到 8K。

音频反应舞者进化

使用复杂几何图形制作的音频反应背景来转换你的主题。

关注我们
  • 领英
  • Facebook
  • Instagram
  • Twitter
支持
  • Discord
  • 电子邮件
  • 系统状态
  • 附属
资源
  • 免费 ComfyUI 在线版
  • ComfyUI 指南
  • RunComfy API
  • ComfyUI 教程
  • ComfyUI 节点
  • 了解更多
法律
  • 服务条款
  • 隐私政策
  • Cookie 政策
RunComfy
版权 2025 RunComfy. 保留所有权利。

RunComfy 是首选的 ComfyUI 平台,提供 ComfyUI 在线 环境和服务,以及 ComfyUI 工作流 具有惊艳的视觉效果。 RunComfy还提供 AI Playground, 帮助艺术家利用最新的AI工具创作出令人惊叹的艺术作品。