Uni3C 工作流程将先进的 Uni3C(精确统一 3D 增强摄像机和人物运动控制)模型集成到 ComfyUI 环境中。由 DAMO Academy (Alibaba Group) 开发,Uni3C 通过在单个 3D 增强框架中统一摄像机轨迹控制和人物运动控制,解决了可控视频生成的根本挑战。
基于 FLUX 扩散变换器架构并由 Wan2.1 基础模型提供支持,Uni3C 引入了 PCDController——一个即插即用的控制模块,利用从单目深度估计中得出的未投影点云。这种方法在保持大规模视频扩散模型生成能力的同时,实现了 Uni3C 内的精确摄像机控制。Uni3C 系统采用 SMPL-X 角色模型和全球 3D 世界指导,实现了环境场景和人物角色间空间一致的视频生成。
Uni3C 通过 视频参考提取 进行操作,分析参考视频以理解摄像机运动和人物动作,然后应用这些模式从输入图像生成新视频。这种方法使得 Uni3C 能够在无需手动参数调整的情况下实现精确控制。
从参考视频中提取摄像机运动并将其应用于新场景,使用 Uni3C。
Load Video (Upload)
节点上传任何具有有趣摄像机运动的视频
Load Image
节点上传您的基础图像(适用于任何风格:真实、动漫、艺术作品、AI 生成)使用 Uni3C 将参考视频中的人物动作转移到不同角色。
性能优化架构: Uni3C 工作流程 实施了多种优化策略,包括将 PCDController 的隐藏尺寸从 5120 减少到 1024,零初始化的线性投影层,以及仅在基础模型的前 20 层注入摄像机控制特性。通过减少的采样步骤(10 vs 20+)和调整的 CFG 引导比例,提供了高达 4 倍的处理速度提升,同时保持 Uni3C 的生成质量。
4倍速度提升配置: 基于 Uni3C 的内置优化,以下设置显著提高处理速度:
WanVideo 采样器节点设置:
Steps
: 10(从默认的 20+ 减少)CFG
: 1.0-1.5(优化速度与质量的平衡)Shift
: 5.0-7.0(作者推荐 7 以获得最佳效果,5 以更快的处理速度使用 Uni3C)Scheduler
: UniPC(优化的调度器用于 Uni3C)关键性能特性:
质量与速度选项:
参考视频处理部分:
Load Video (Upload)
: 接受 MP4、AVI 和其他标准视频格式,供 Uni3C 用于动作参考。WanVideo Encode
: 处理参考视频以提取摄像机轨迹和动作模式,供 Uni3C 使用。Uni3C ControlNet Loader
: 加载专门的 Uni3C 控制模型以理解动作。图像到视频生成部分:
Load Image
: 您的目标图像,将由 Uni3C 使用参考动作进行动画化。WanVideo Image/ToVideo Encode
: 将您的静态图像转换为适合 Uni3C 视频生成的格式。WanVideo Sampler
: 核心生成引擎,具有 Uni3C 的 4 倍速度提升优化设置。输出处理:
WanVideo Decode
: 将生成的潜在视频从 Uni3C 转换回可查看格式。Video Combine
: 将最终视频文件与适当的帧速率和编码从 Uni3C 组装。此工作流程由 Uni3C 提供支持,由 DAMO Academy (Alibaba Group)、Fudan University 和 Hupan Lab 开发。ComfyUI 集成基于 kijai 的出色工作(ComfyUI-WanVideoWrapper),并进行了额外的优化和工作流程设计,使这一强大的 Uni3C 技术在全球创作者中更易于访问。
RunComfy 是首选的 ComfyUI 平台,提供 ComfyUI 在线 环境和服务,以及 ComfyUI 工作流 具有惊艳的视觉效果。 RunComfy还提供 AI Playground, 帮助艺术家利用最新的AI工具创作出令人惊叹的艺术作品。