Wan 2.2 Qwen 多角度拆分堆栈:将一张照片转换为同步的 5 角度 9:16 视频
Wan 2.2 Qwen 多角度拆分堆栈在 ComfyUI 中将单个图像转换为五个不同的摄像机角度,动画化每一个,然后将它们组合成干净的 9:16 垂直拆分堆栈。结果是一个同步的多视角视频,非常适合产品展示、角色旋转和社交媒体就绪帖子。
从一个输入中您可以得到六个交付物:五个单独的 Wan 2.2 图像到视频 (I2V) 片段和一个最终的堆叠剪辑。工作流有其见解但灵活,您可以更换提示、调整持续时间和调整构图而无需触及任何安装细节。
ComfyUI Wan 2.2 Qwen 多角度拆分堆栈工作流中的关键模型
- Wan 2.2 图像到视频扩散 (14B,高噪声和低噪声 UNet 对) 带有可选的 LightX2V 4 步 LoRA 以提高速度。此模型将静态图像转换为动态图像,同时保留主体身份和场景布局。来源:Comfy-Org Wan 2.2 repack,包括 LoRA 文件和 VAE 资产。Hugging Face
- Qwen-Image-Edit 2511 用于视点感知图像编辑。它从单个输入生成同一主题的五个角度变体,并通过两个 LoRAs 增强:Multiple-Angles(用于一致的偏航/俯仰变化)和 Lightning 4 步(用于快速、高质量编辑)。Comfy-Org Qwen-Image-Edit • Multiple-Angles LoRA • Lightning 4-steps LoRA
- Qwen 2.5-VL 7B 视觉语言编码器。用于调节和解析编辑提示,引导 Qwen-Image-Edit 进行干净、可重复的角度变化。Hugging Face
- VAE 用于解码和编码潜变量:Wan 2.1 VAE 用于 Wan I2V 和 Qwen Image VAE 用于图像编辑路径。Wan VAE • Qwen Image VAE
- RIFE 帧插值用于统一平滑度和帧节奏在堆叠之前。它减少了五个剪辑之间的时间抖动。GitHub
如何使用 ComfyUI Wan 2.2 Qwen 多角度拆分堆栈工作流
整体流程:一张图像通过 Qwen 产生五个角度一致的静态图像,每个静态图像由 Wan 2.2 动画化为一个剪辑,然后所有剪辑被调整大小并堆叠成一个 9:16 视频。
1) 加载和设置全局长度/大小
- 将您的源文件拖放到
LoadImage(#41)。这是唯一需要的用户资产。 - 设置
width(#207)、height(#208) 和frame length(#214)。这三个整数同时驱动所有五个 Wan 2.2 动画。 - 堆叠器随后将每个窗格调整为统一的瓷砖,以便您可以保持方形 I2V 渲染以保持主体稳定性,并仍然获得 1080×1920 的最终堆栈。
2) 使用 Qwen 生成五个多角度静态图像
- 五个
QwenMultiangleCameraNode实例 (#964, #984, #1022, #1041, #1060) 分析输入并生成摄像机角度提示(例如,轻微左侧、侧面、微妙的上下倾斜)。 - 每个提示传递给
Qwen Generate组 (#962, #983, #1021, #1040, #1059),该组使用 Qwen-Image-Edit 与 Multiple-Angles 和 Lightning LoRAs 渲染出逼真的视点变化,同时保持身份、服装和背景一致。 - 预览图像被保存(
SaveImage节点 #369, #460, #534, #607, #680),以便您可以在动画之前快速检查角度。
3) 使用 Wan 2.2 I2V 为每个角度动画化
- 五个
Image to Video (Wan2.2)子图以每个编辑的静态图像作为start_image并产生动态剪辑(WanImageToVideo在 #772, #774, #775, #837, #839 内)。 - 所有五个共享来自全局整数的相同长度和分辨率,这保持了运动和框架在窗格之间的同步。
- 如果您希望每个窗格的摄像机行为不同,可以在每个 I2V 节点中提供一个简短的运动提示,或者将它们对齐以获得完美匹配的拆分堆栈。
4) 构建 9:16 拆分堆栈
- 每个剪辑通过
GetVideoComponents和RIFE VFI正常化帧节奏,然后通过ResizeImageMaskNode调整为 1080×384 的瓷砖大小。 - 瓷砖由
ImageStitch在组合堆栈子图中垂直缝合(Composite Stack 1–5,例如,#925 → #927 → #932 → #937 → #942)。 CreateVideo(#758) 组装堆叠的帧,SaveVideo(#759) 写入最终的 9:16 超级剪辑。
5) 可导出项目
- 个别角度剪辑由
SaveVideo(#203, #464, #537, #610, #683) 保存。 - 堆叠视频由
SaveVideo(#759) 保存。文件名已预填充;您可以更改它们以匹配您的项目。
ComfyUI Wan 2.2 Qwen 多角度拆分堆栈工作流中的关键节点
QwenMultiangleCameraNode (#964 等)
这个节点家族从单个图像生成五个角度感知的提示,这是 Wan 2.2 Qwen 多角度拆分堆栈外观的基础。用作跨运行标准化偏航/俯仰变化的地方。此处添加的小提示如“统一的工作室照明”或“中性背景”有助于 Qwen-Image-Edit 保持边缘和阴影稳定。请参阅模型页面了解 Qwen-Image-Edit 及其 LoRAs 的功能和限制。Qwen-Image-Edit • Multiple-Angles LoRA
Qwen Generate (#962)
这个子图将 Qwen-Image-Edit 2511 与 Multiple-Angles 和 Lightning 4 步 LoRAs 以及 Qwen 2.5-VL 文本编码器结合在一起。它将每个摄像机指令转换为干净、保留身份的静态图像。如果您需要更强的原始依从性,请在嵌入的 TextEncodeQwenImageEditPlus 中调整积极文本以强调主题特征或产品特征。Lightning 4-steps • Qwen 2.5-VL 7B
WanImageToVideo (#772)
这是 Wan 2.2 I2V 内核,将每个编辑的静态图像转换为动态。节点读取全局 width、height 和 length,您可以添加一个简短的运动提示来定义缩放或微妙的主体运动。切换 I2V 子图中的 4 步 LoRA,如果您想要更快的渲染接近基线质量;如果您更喜欢最大保真度,请将其关闭。Wan 2.2 I2V
RIFE VFI (#926)
用于在缝合前平滑和对齐剪辑节奏。仅在您的源运动看起来不流畅时增加插值;更高的因素会增加渲染时间。RIFE 轻量化并且与 Wan 2.2 的固定步长解码配合良好,这就是它在堆叠之前的位置。Practical-RIFE
ImageStitch (#912)
构建 5 行垂直面板。将方向设置为“向下”以保持 9:16 布局。如果您决定使用少于五个角度,请在上游调整节点中调整瓷砖高度,以便组合高度仍然总计为 1920 像素,以获得完美的 1080×1920 导出。
可选额外功能
- 创意控制:使用绿色的“Create Prompt”字符串节点添加样式注释一次,然后让 Qwen 在所有角度一致地传播它们。
- 一致性提示:要求“统一的工作室照明、中性背景、居中主体”以最小化堆栈中的变化。
- 性能:如果 VRAM 紧张,先降低
width和height,然后是frame length。堆叠器仍将输出 9:16 视频。 - 更少或更多面板:您可以运行任何角度的子集;只需重新缝合匹配的瓷砖高度,以便最终画布仍然是 1080×1920。
- 可交付物混合:分享堆叠的超级剪辑用于社交媒体,并保留五个单独的 Wan 2.2 剪辑用于细节镜头、缩略图或循环。
致谢
此工作流实现并构建于以下作品和资源之上。我们诚挚感谢 hellorob 对 Wan 2.2 Qwen 多角度拆分堆栈源 ComfyUI 工作流的贡献和维护。有关权威详细信息,请参阅下面链接的原始文档和存储库。
资源
- hellorob/Wan 2.2 Qwen 多角度拆分堆栈源
- GitHub: Comfy-Org/workflow_templates
- 文档 / 发布说明: Wan 2.2 Qwen 多角度拆分堆栈源
注意:使用所引用的模型、数据集和代码须遵循其作者和维护者提供的相应许可和条款。

