ComfyUI>Workflows>Wan2.2 VACE Fun | Image en vidéo animée

Wan2.2 VACE Fun | Image en vidéo animée

Workflow Name: RunComfy/Wan2.2-VACE-Fun

Workflow ID: 0000...1290

Ce flux de travail vous aide à transformer n'importe quelle image fixe en vidéo animée guidée par des invites écrites. Il vous permet de maintenir l'identité du sujet tout en ajoutant des actions ou mouvements expressifs. Vous pouvez facilement donner vie à des photos de référence et contrôler comment votre sujet se déplace. Conçu pour la narration, il rend la visualisation de concepts plus rapide et plus engageante. Il est parfait pour créer des animations uniques pour le contenu social, les présentations ou les projets créatifs. En combinant efficacité et précision, il offre des résultats fiables même pour des idées complexes.

Wan2.2 VACE Fun : Image de référence en vidéo animée dans ComfyUI

Wan2.2 VACE Fun est un flux de travail créatif, basé sur des invites, pour la conversion de référence en vidéo dans ComfyUI. Fournissez une seule image de référence et une description textuelle, et le graphe anime votre sujet en une vidéo cohérente tout en préservant l'identité et le style. Construit sur le module Wan 2.2 VACE avec un échantillonneur en plusieurs étapes, il équilibre mouvement, fidélité et temps d'exécution, ce qui le rend idéal pour les bandes conceptuelles, les tests de personnages et les courts clips narratifs.

Ce flux de travail ComfyUI Wan2.2 VACE Fun se concentre sur trois aspects : une forte adhérence au sujet à partir de l'image de référence, un mouvement expressif guidé par votre invite, et une exportation fiable en vidéo MP4. Utilisez-le lorsque vous avez besoin d'itérations rapides qui conservent un aspect cinématographique, ou lorsque vous souhaitez transformer une image fixe en scène dynamique sans encadrement complexe.

Modèles clés dans le flux de travail Comfyui Wan2.2 VACE Fun

Alibaba PAI Wan 2.2 VACE Fun A14B. Le module VACE est le cœur qui transforme une image de référence plus des invites en une séquence latente prête pour la vidéo. Il est conçu pour l'animation axée sur le sujet et la préservation de l'identité. Carte du modèle
Wan 2.2 Text-to-Video A14B (HIGH/LOW). Le flux de travail utilise des variantes HIGH et LOW dans un pipeline de débruitage en étapes pour échanger vitesse et détail là où chacun est le plus efficace. Des poids emballés compatibles avec ComfyUI sont disponibles ici : Comfy-Org/Wan_2.2_ComfyUI_Repackaged
UMT5-XXL encodeur de texte. Un grand encodeur de texte multilingue utilisé par Wan 2.x pour la compréhension des invites ; il prend en charge des invites riches en anglais et en chinois. Voir les encodeurs de texte réemballés dans Comfy-Org/Wan_2.2_ComfyUI_Repackaged
Wan 2.1 VAE. Utilisé pour décoder les latents vidéo finaux en trames RGB avant encodage. Disponible dans le même pack : Comfy-Org/Wan_2.2_ComfyUI_Repackaged

Comment utiliser le flux de travail Comfyui Wan2.2 VACE Fun

Le flux de travail se déroule par étapes : vous définissez des contrôles globaux, préparez l'image de référence, rédigez des invites, générez une vidéo latente conditionnée par VACE, affinez-la par échantillonnage en étapes, puis décodez et exportez. Les groupes sont organisés pour que vous puissiez travailler de haut en bas avec un minimum de friction.

Réglage

Ce groupe centralise les contrôles que le reste du graphe lit : width, height, length (trames), fps, steps, sampling_shift, et seed. Changez-les une fois et chaque nœud en aval récupère les valeurs via des paires SetNode/GetNode. La résolution et la longueur influencent à la fois la qualité et la VRAM, tandis que fps contrôle le mouvement perçu dans le MP4 final. Gardez width et height alignés sur l'aspect de votre image de référence pour éviter l'étirement. Le seed est exposé pour la reproductibilité entre les exécutions.

Img Réf

Chargez votre sujet avec LoadImage (#118), puis l'image est redimensionnée dans ImageResizeKJv2 (#112) pour correspondre à votre résolution cible. RMBG (#73) supprime l'arrière-plan afin que VACE puisse se concentrer plus fiablement sur le sujet au premier plan, aidant à la cohérence de l'identité entre les trames. Un nœud de prévisualisation vous permet d'inspecter rapidement la découpe avant la génération. L'image traitée est stockée comme référence et alimentée en aval.

Invite

Les invites sont encodées avec CLIP Text Encode (Positive Prompt) (#56) et CLIP Text Encode (Negative Prompt) (#54) en utilisant l'encodeur UMT5-XXL. Écrivez des verbes d'action clairs, un langage de caméra, et un contexte de scène dans l'invite positive pour diriger le mouvement et la composition. Utilisez l'invite négative pour supprimer les artefacts, styles ou encombrements indésirables ; la phraséologie multilingue fonctionne bien. Les sorties fournissent un conditionnement riche pour l'étape VACE et les échantillonneurs qui suivent.

Modèles

Le graphe charge les poids Wan 2.2 T2V A14B et applique le module Wan2.2 VACE Fun, puis augmente l'attention et la planification pour la stabilité. La branche HIGH passe par PathchSageAttentionKJ (#8) et ModelSamplingSD3 (#57), tandis que la branche LOW utilise LoraLoaderModelOnly (#61), PathchSageAttentionKJ (#66), et ModelSamplingSD3 (#20). Cette division vous donne un passage précoce axé sur le détail et un raffinement axé sur le mouvement. Tous les choix de modèles sont pré-câblés ; vous exécutez simplement le graphe une fois vos paramètres et vos invites prêts.

Condition VACE

WanVaceToVideo (#43) injecte votre reference_image, le conditionnement positif/négatif, et le VAE, puis génère une séquence vidéo latente initiale dimensionnée par width, height, et length. Considérez cela comme le moment où l'image fixe "apprend" à se mouvoir selon votre invite. Le nœud retourne à la fois les flux de conditionnement pour réutilisation et un entier pour la découpe latente afin de garder le pipeline cohérent en trames. Aucun masque manuel ou vidéo de contrôle n'est requis à moins que vous ne souhaitiez expérimenter.

Échantillonnage

Une pile d'échantillonneurs en trois étapes façonne le résultat. Le premier passage KSamplerAdvanced (#108) ensemence la séquence latente pour des indices de composition et de mouvement globaux. Le deuxième passage KSamplerAdvanced (#107) approfondit le détail et la stabilité temporelle en utilisant le même conditionnement tout en préservant la mise en page de la scène. Le dernier passage KSamplerAdvanced (#109) fonctionne sur la variante LOW pour polir le mouvement et réduire les artefacts, trouvant un équilibre pratique entre vitesse et qualité. TrimVideoLatent (#65) aligne les trames sur la longueur cible avant le décodage.

Sortie

VAEDecode (#19) transforme les latents raffinés en trames RGB. VHS_VideoCombine (#69) assemble ensuite ces trames en un MP4 à votre fps choisi, en sauvegardant avec un schéma de nom de fichier sensé. Ce groupe est optimisé pour des boucles de révision rapide, afin que vous puissiez itérer sur les invites, la longueur ou la résolution sans toucher au reste du graphe. Lorsque vous êtes satisfait, gardez le même seed pour la répétabilité ou changez-le pour explorer des variations.

Nœuds clés dans le flux de travail Comfyui Wan2.2 VACE Fun

WanVaceToVideo (#43)
Le cœur de Wan2.2 VACE Fun : il lie la sémantique des invites à votre image de référence et produit les latents vidéo initiaux. Ajustez width, height, et length ici via les paramètres partagés pour correspondre à votre objectif créatif et budget VRAM. Gardez le sujet de référence centré et bien éclairé pour une meilleure rétention de l'identité. Si le mouvement semble erroné, révisez l'invite positive pour mettre en avant les actions, les mouvements de caméra, et les mots de timing.

KSamplerAdvanced (#108, #107, #109)
Une chaîne d'échantillonneurs en étapes qui améliore progressivement la composition, le détail et la fluidité du mouvement. Augmentez steps lorsque vous avez besoin de plus de détail ou de stabilité temporelle, et réutilisez le même seed pour comparer équitablement les changements. Le dernier passage sur la variante LOW nettoie souvent des artefacts subtils ; si les résultats semblent trop doux, déplacez quelques étapes vers les passages précédents. sampling_shift est exposé pour ajuster le calendrier soit vers l'accentuation du mouvement, soit vers une texture plus fine.

RMBG (#73)
La suppression automatique de l'arrière-plan améliore l'adhérence au sujet pour Wan2.2 VACE Fun, notamment avec des scènes chargées ou à faible contraste. Utilisez des références de haute qualité, non floues, pour minimiser les erreurs de découpe. Si vous souhaitez des arrière-plans naturels, remplacez-les plus tard en post-production ou compositez une plaque derrière les trames décodées.

TrimVideoLatent (#65)
Garde la séquence latente alignée sur la length demandée. Si vous allongez ou raccourcissez un clip, laissez ce nœud gérer la comptabilité ; il prévient la dérive subtile des trames à travers les étapes de l'échantillonneur.

VHS_VideoCombine (#69)
Encode les trames finales en MP4. Ajustez frame_rate pour contrôler la durée du clip par rapport à length (la durée équivaut aux trames divisées par fps). Augmentez la qualité pour la livraison finale ou réduisez-la pour des aperçus rapides ; une qualité supérieure augmente la taille du fichier et le temps d'encodage.

Extras optionnels

Commencez avec une image de référence dont l'aspect correspond à votre width et height cible pour éviter les étirements et les recadrages indésirables.
Rédigez des invites qui décrivent l'action et le mouvement de la caméra, pas seulement l'apparence ; Wan2.2 VACE Fun réagit bien aux verbes comme "marche", "panoramique", "dolly", et "coup de fouet".
Gardez length et fps en accord avec votre objectif : un fps plus élevé semble plus fluide mais raccourcit la durée totale pour le même nombre de trames.
Si l'identité vacille, simplifiez l'arrière-plan via RMBG et ajoutez une clause d'identité brève dans l'invite (vêtements, couleur ou équipement).
Pour des brouillons plus rapides, réduisez la résolution ou les étapes, puis restaurez-les pour les finales ; gardez le même seed pour comparer les versions de manière fiable.

Remerciements

Ce flux de travail implémente et s'appuie sur les travaux et ressources suivants. Nous remercions chaleureusement @BenjisAIPlayground pour le flux de travail "Wan2.2 VACE Fun Demo" et pour leurs contributions et entretien. Pour des détails autoritaires, veuillez vous référer à la documentation originale et aux dépôts liés ci-dessous.

Ressources

PWan2.2 VACE Fun Demo
- Docs / Notes de version @BenjisAIPlayground: YouTube

Remarque : L'utilisation des modèles, ensembles de données et codes référencés est soumise aux licences et conditions respectives fournies par leurs auteurs et mainteneurs.

Want More ComfyUI Workflows?

Wan 2.2 FLF2V | Génération de Vidéo Premier-Dernier Cadre

Générez des vidéos fluides à partir d'un cadre de début et de fin en utilisant Wan 2.2 FLF2V.

Wan 2.2 + Lightx2v V2 | I2V & T2V Ultra Rapide

Configuration Dual Light LoRA, 4X plus rapide.

Wan FusionX | T2V+I2V+VACE Complet

La solution de génération vidéo la plus puissante à ce jour ! Détails de qualité cinéma, votre studio de film personnel.

Flux Consistent Characters | Input Image

Créez des personnages cohérents et assurez-vous qu'ils paraissent uniformes en utilisant vos images.

Audioreactive Dancers Evolved

Transformez votre sujet avec un arrière-plan audioreactif composé de géométries complexes.

PuLID Flux II | Génération de Personnages Cohérente

Générez des images avec un contrôle précis des personnages tout en préservant le style artistique.

Flux Depth et Canny

Outils Flux officiels - Modèle Flux Depth et Canny ControlNet

LBM Relighting | I2I

Rééclairez les sujets en utilisant des entrées d'éclairage basées sur l'image avec LBM.

Support

Ressources

Légal

RunComfy

RunComfy est la première ComfyUI plateforme, offrant des ComfyUI en ligne environnement et services, ainsi que des workflows ComfyUI proposant des visuels époustouflants. RunComfy propose également AI Playground, permettant aux artistes d'utiliser les derniers outils d'IA pour créer des œuvres d'art incroyables.