UNO | 一致的主体与对象生成
UNO 工作流为 ComfyUI 带来了先进的图像生成技术至 RunComfy。这个强大的模型在提供参考主体时,能够生成高度一致的图像。不论是单一主体生成(在不同场景中的角色)还是主体-对象合成(在一张图像中结合特定对象和主体),ComfyUI UNO 都能提供卓越的保真度和质量。即便在较小的云服务器上,该模型也能有效运行,使 ComfyUI UNO 图像定制对所有人都可及。非常适合产品可视化、角色插图、创意合成等。ComfyUI UNO Subject-Object Generation 工作流程
ComfyUI UNO Subject-Object Generation 示例




ComfyUI UNO Subject-Object Generation 描述
ComfyUI UNO 描述
1. 什么是 ComfyUI UNO?
ComfyUI UNO 工作流将字节跳动的 Universal aNd cOntrollable (UNO) 模型集成到 ComfyUI 环境中。由字节跳动智能创造团队开发,UNO 代表了基于创新的 "Less-to-More" 泛化范式的主体驱动图像生成技术的重要进步。ComfyUI UNO 工作流在各种语境和场景中实现了灵活且高保真的图像生成,同时保持参考主体的身份特征的一致性。
2. ComfyUI UNO 的优势:
- 卓越的主体一致性: ComfyUI UNO 在不同语境中保持卓越的主体相似性。
- 主体-对象控制: 与许多替代方案不同,ComfyUI UNO 擅长同时处理主体参考和对象参考,而不会导致身份混淆。
- 通用兼容性: ComfyUI UNO 适用于多种类型的主体——人、物体、玩具、标志等。
- 资源效率: 即便在有限的 VRAM 资源下,ComfyUI UNO 也能提供专业质量的结果(在 24GB 下效果良好)。
- 灵活实施: ComfyUI UNO 包括单一主体和主体-对象生成的工作流。
3. 如何使用 ComfyUI UNO
3.1 工作流设置
ComfyUI UNO 工作流有两个主要配置:
顶部组 - 主体-对象生成:
- 此配置允许您输入一个参考主体图像和一个参考对象图像,并根据您的文本提示在生成的场景中组合它们。
底部组 - 单一主体生成:
- 此配置使用单一参考图像,并在不同的语境中生成该主体的新图像。
3.2 使用 ComfyUI UNO 的生成过程
基本设置:
- 加载参考图像:
- 对于主体-对象工作流(顶部组):上传一个主体参考图像和一个对象参考图像
- 对于单一主体工作流(底部组):上传一个参考图像
- 为 ComfyUI UNO 设置文本提示:
- 为您期望的场景编写描述性提示,包括参考主体/对象应如何出现
- 调整 ComfyUI UNO 参数:
Width/Height
:确定输出分辨率(推荐 768×1024 或 1024×1024)Guidance
:控制 ComfyUI UNO 生成与您的文本提示的贴合程度(推荐 3.5-4.0)Num_steps
:较高的值(20+)能产生更一致的结果,尤其是人脸Seed
:设置特定的种子以便重现,或随机化以获得多样的输出
- 使用 ComfyUI UNO 生成图像:
- 点击 "Queue Prompt" 运行 ComfyUI UNO 工作流
- 在 "Save Image" 节点中查看结果
3.3 ComfyUI UNO 的参数参考
UNO Loadmodel Node:
model_type
:确定使用哪个 ComfyUI UNO 模型变体flux-dev
:标准 ComfyUI UNO 模型,质量与性能的良好平衡flux-schnell
:速度更快的 ComfyUI UNO 模型变体,质量略低
3.4 使用 ComfyUI UNO 获得最佳结果的提示
ComfyUI UNO 的主体选择:
- 选择清晰、光线良好的参考图像,主体突出
- 对于面孔/人物,正面图像和中性表情效果最佳
- 对于物体,背景干扰最小的清晰图像是理想的
ComfyUI UNO 的提示工程:
- 针对与您的参考图像匹配的主体描述要具体
- 描述期望的场景、光线和构图
- 包括对特定主体的引用(例如 "a young man", "a vintage bicycle")
- 保持提示简洁但详细,以获得最佳结果
4. ComfyUI UNO 的技术信息
ComfyUI UNO 技术建立在 FLUX 模型之上,并利用 DiT (Diffusion Transformer) 架构进行多项关键增强:
- Universal Rotary Position Embedding (UnoPE): 在 ComfyUI UNO 中帮助模型区分参考主体和对象的专门机制,显著减少属性混淆。
- Progressive Cross-Modal Alignment: 训练方法,使 ComfyUI UNO 能够处理日益复杂的多条件控制。
- Universal Customization: ComfyUI UNO 能够处理多种主体类型,无需专门训练。
5. 致谢
此 ComfyUI 工作流由 UNO 提供支持,由字节跳动的 智能创造团队(Shaojin Wu, Mengqi Huang, Wenxu Wu, Yufeng Cheng, Fei Ding, 和 Qian He)开发。字节跳动的 UNO 在 ComfyUI 中的集成由社区贡献者提供,将突破性的研究转化为可访问的工作流。
有关 UNO 的更多信息,请访问 。