Wan 2.2 Qwen Multiangle Split Stack : transformez une photo en une vidéo synchronisée à 5 angles 9:16
Le Wan 2.2 Qwen Multiangle Split Stack dans ComfyUI convertit une seule image en cinq angles de caméra distincts, anime chacun d'eux, puis les assemble en un empilement vertical propre 9:16. Le résultat est une vidéo multi-perspectives synchronisée idéale pour les présentations de produits, les rotations de personnages et les publications prêtes pour les réseaux sociaux.
À partir d'une entrée, vous obtenez six livrables : cinq clips image-à-vidéo (I2V) individuels Wan 2.2 et un supercut final empilé. Le workflow est structuré mais flexible, vous permettant de changer les invites, d'ajuster la durée et de modifier la composition sans toucher aux détails d'installation.
Modèles clés dans le workflow Comfyui Wan 2.2 Qwen Multiangle Split Stack
- Diffusion Image-à-Vidéo Wan 2.2 (14B, paire UNet haute et basse fréquence) avec option LoRA LightX2V en 4 étapes pour la vitesse. Ce modèle transforme une image fixe en mouvement tout en préservant l'identité du sujet et la disposition de la scène. Source : Comfy-Org Wan 2.2 repack, y compris les fichiers LoRA et les actifs VAE. Hugging Face
- Qwen-Image-Edit 2511 pour l'édition d'image sensible aux points de vue. Il génère cinq variantes d'angle du même sujet à partir de l'entrée unique et est amélioré ici par deux LoRAs : Multiple-Angles (pour des changements de tangage/roulis cohérents) et Lightning 4-steps (pour des éditions rapides et de haute qualité). Comfy-Org Qwen-Image-Edit • Multiple-Angles LoRA • Lightning 4-steps LoRA
- Encodeur vision-langage Qwen 2.5-VL 7B. Utilisé pour conditionner et analyser les invites d'édition qui orientent Qwen-Image-Edit vers des changements d'angle propres et répétables. Hugging Face
- VAEs pour le décodage et l'encodage des latents : Wan 2.1 VAE pour Wan I2V et Qwen Image VAE pour le chemin d'édition d'image. Wan VAE • Qwen Image VAE
- Interpolation de trame RIFE pour unifier la fluidité et la cadence des trames avant l'empilement. Il réduit les tremblements temporels sur les cinq clips. GitHub
Comment utiliser le workflow Comfyui Wan 2.2 Qwen Multiangle Split Stack
Flux global : une image passe par Qwen pour produire cinq images fixes cohérentes en termes d'angle, chaque image fixe est animée par Wan 2.2 en un clip, puis tous les clips sont redimensionnés et empilés de haut en bas en une vidéo 9:16.
1) Charger et définir la longueur/taille globale
- Déposez votre source dans
LoadImage(#41). C'est le seul élément utilisateur requis. - Définissez
width(#207),height(#208) etframe length(#214). Ces trois entiers pilotent simultanément les cinq animations Wan 2.2. - Le stacker redimensionne ensuite chaque volet à une taille uniforme afin que vous puissiez garder les rendus I2V carrés pour la stabilité du sujet et obtenir quand même un empilement final 1080×1920.
2) Générer cinq images fixes multi-angles avec Qwen
- Les cinq instances
QwenMultiangleCameraNode(#964, #984, #1022, #1041, #1060) analysent l'entrée et produisent des invites de caméra (par exemple, légèrement à gauche, profil, légère inclinaison haut/bas). - Chaque invite est transmise à un groupe
Qwen Generate(#962, #983, #1021, #1040, #1059) qui utilise Qwen-Image-Edit avec les LoRAs Multiple-Angles et Lightning pour rendre un changement de point de vue photoréaliste tout en gardant l'identité, les vêtements et l'arrière-plan cohérents. - Les images de prévisualisation sont enregistrées (nœuds
SaveImage#369, #460, #534, #607, #680) afin que vous puissiez rapidement inspecter les angles avant l'animation.
3) Animer chaque angle avec Wan 2.2 I2V
- Cinq sous-graphes
Image to Video (Wan2.2)prennent chaque image fixe éditée commestart_imageet produisent des clips de mouvement (WanImageToVideoà l'intérieur #772, #774, #775, #837, #839). - Les cinq partagent la même longueur et résolution des entiers globaux, ce qui maintient le mouvement et le cadrage synchronisés à travers les panneaux.
- Vous pouvez fournir une courte invite de mouvement dans chaque nœud I2V si vous souhaitez un comportement de caméra différent par panneau, ou les laisser alignés pour un empilement parfaitement assorti.
4) Construire l'empilement 9:16
- Chaque clip passe par
GetVideoComponentsetRIFE VFIpour normaliser la cadence des trames, puis parResizeImageMaskNodeà une taille de tuile de 1080×384. - Les tuiles sont assemblées verticalement par
ImageStitchà l'intérieur des sous-graphes Composite Stack (Composite Stack 1–5, par exemple, #925 → #927 → #932 → #937 → #942). CreateVideo(#758) assemble les images empilées etSaveVideo(#759) écrit le supercut final 9:16.
5) Exportables
- Les clips d'angle individuels sont enregistrés par
SaveVideo(#203, #464, #537, #610, #683). - La vidéo empilée est enregistrée par
SaveVideo(#759). Les noms de fichiers sont pré-remplis ; vous pouvez les changer pour correspondre à votre projet.
Nœuds clés dans le workflow Comfyui Wan 2.2 Qwen Multiangle Split Stack
QwenMultiangleCameraNode (#964 et al.)
Cette famille de nœuds génère cinq invites sensibles à l'angle à partir de l'image unique, qui est la base de l'apparence du Wan 2.2 Qwen Multiangle Split Stack. Utilisez-le comme point de départ pour standardiser les changements de tangage/roulis au fil des exécutions. De petites additions d'invite comme "éclairage de studio cohérent" ou "arrière-plan neutre" ici aident Qwen-Image-Edit à garder les bords et les ombres stables. Voir les pages des modèles pour les capacités et les contraintes de Qwen-Image-Edit et de ses LoRAs. Qwen-Image-Edit • Multiple-Angles LoRA
Qwen Generate (#962)
Ce sous-graphe enveloppe Qwen-Image-Edit 2511 avec les LoRAs Multiple-Angles et Lightning 4-steps plus l'encodeur de texte Qwen 2.5-VL. Il convertit chaque instruction de caméra en une image fixe propre et préservant l'identité. Si vous avez besoin d'une adhérence plus forte à l'original, ajustez le texte positif dans le TextEncodeQwenImageEditPlus intégré pour mettre en valeur les traits du sujet ou les caractéristiques du produit. Lightning 4-steps • Qwen 2.5-VL 7B
WanImageToVideo (#772)
C'est le noyau Wan 2.2 I2V qui transforme chaque image fixe éditée en mouvement. Le nœud lit les width, height et length globaux, et vous pouvez ajouter une courte invite de mouvement pour définir des zooms ou un mouvement subtil du sujet. Activez le 4-steps LoRA à l'intérieur du sous-graphe I2V si vous souhaitez des rendus plus rapides à une qualité quasi-baseline ; laissez-le désactivé si vous préférez une fidélité maximale. Wan 2.2 I2V
RIFE VFI (#926)
Utilisé pour lisser et aligner la cadence des clips avant l'assemblage. Augmentez l'interpolation uniquement si votre mouvement source semble saccadé ; des facteurs plus élevés augmentent le temps de rendu. RIFE est léger et s'associe bien avec le décodage à étapes fixes de Wan 2.2, c'est pourquoi il se situe juste avant l'empilement. Practical-RIFE
ImageStitch (#912)
Construit le panneau vertical à 5 rangées. Gardez la direction réglée sur "bas" pour préserver la mise en page 9:16. Si vous décidez d'utiliser moins de cinq angles, ajustez la hauteur des tuiles dans le nœud de redimensionnement en amont afin que la hauteur combinée totalise toujours 1920 px pour un export parfait 1080×1920.
Extras optionnels
- Contrôle créatif : Utilisez les nœuds de chaîne "Create Prompt" en vert pour ajouter des notes de style une fois, puis laissez Qwen les propager de manière cohérente sur tous les angles.
- Conseils de cohérence : Demandez "éclairage de studio uniforme, arrière-plan neutre, sujet centré" pour minimiser la variation à travers l'empilement.
- Performance : Si la VRAM est limitée, réduisez d'abord
widthetheight, puisframe length. Le stacker produira toujours une vidéo 9:16. - Moins ou plus de panneaux : Vous pouvez exécuter n'importe quel sous-ensemble d'angles ; réassemblez simplement avec des hauteurs de tuiles assorties pour que la toile finale reste 1080×1920.
- Mélange de livrables : Partagez le supercut empilé pour les réseaux sociaux et conservez les cinq clips Wan 2.2 individuels pour les plans détaillés, les vignettes ou les boucles.
Remerciements
Ce workflow implémente et s'appuie sur les travaux et ressources suivants. Nous remercions chaleureusement hellorob pour le workflow Source ComfyUI Wan 2.2 Qwen Multiangle Split Stack pour leurs contributions et leur maintenance. Pour des détails autoritaires, veuillez vous référer à la documentation et aux dépôts originaux liés ci-dessous.
Ressources
- hellorob/Wan 2.2 Qwen Multiangle Split Stack Source
- GitHub: Comfy-Org/workflow_templates
- Docs / Notes de version: Wan 2.2 Qwen Multiangle Split Stack Source
Note : L'utilisation des modèles, ensembles de données et codes référencés est soumise aux licences et termes respectifs fournis par leurs auteurs et mainteneurs.
