Wan2.2 VACE Fun est un flux de travail créatif, basé sur des invites, pour la conversion de référence en vidéo dans ComfyUI. Fournissez une seule image de référence et une description textuelle, et le graphe anime votre sujet en une vidéo cohérente tout en préservant l'identité et le style. Construit sur le module Wan 2.2 VACE avec un échantillonneur en plusieurs étapes, il équilibre mouvement, fidélité et temps d'exécution, ce qui le rend idéal pour les bandes conceptuelles, les tests de personnages et les courts clips narratifs.
Ce flux de travail ComfyUI Wan2.2 VACE Fun se concentre sur trois aspects : une forte adhérence au sujet à partir de l'image de référence, un mouvement expressif guidé par votre invite, et une exportation fiable en vidéo MP4. Utilisez-le lorsque vous avez besoin d'itérations rapides qui conservent un aspect cinématographique, ou lorsque vous souhaitez transformer une image fixe en scène dynamique sans encadrement complexe.
Le flux de travail se déroule par étapes : vous définissez des contrôles globaux, préparez l'image de référence, rédigez des invites, générez une vidéo latente conditionnée par VACE, affinez-la par échantillonnage en étapes, puis décodez et exportez. Les groupes sont organisés pour que vous puissiez travailler de haut en bas avec un minimum de friction.
Ce groupe centralise les contrôles que le reste du graphe lit : width
, height
, length
(trames), fps
, steps
, sampling_shift
, et seed
. Changez-les une fois et chaque nœud en aval récupère les valeurs via des paires SetNode
/GetNode
. La résolution et la longueur influencent à la fois la qualité et la VRAM, tandis que fps
contrôle le mouvement perçu dans le MP4 final. Gardez width
et height
alignés sur l'aspect de votre image de référence pour éviter l'étirement. Le seed est exposé pour la reproductibilité entre les exécutions.
Chargez votre sujet avec LoadImage
(#118), puis l'image est redimensionnée dans ImageResizeKJv2
(#112) pour correspondre à votre résolution cible. RMBG
(#73) supprime l'arrière-plan afin que VACE puisse se concentrer plus fiablement sur le sujet au premier plan, aidant à la cohérence de l'identité entre les trames. Un nœud de prévisualisation vous permet d'inspecter rapidement la découpe avant la génération. L'image traitée est stockée comme référence et alimentée en aval.
Les invites sont encodées avec CLIP Text Encode (Positive Prompt)
(#56) et CLIP Text Encode (Negative Prompt)
(#54) en utilisant l'encodeur UMT5-XXL. Écrivez des verbes d'action clairs, un langage de caméra, et un contexte de scène dans l'invite positive pour diriger le mouvement et la composition. Utilisez l'invite négative pour supprimer les artefacts, styles ou encombrements indésirables ; la phraséologie multilingue fonctionne bien. Les sorties fournissent un conditionnement riche pour l'étape VACE et les échantillonneurs qui suivent.
Le graphe charge les poids Wan 2.2 T2V A14B et applique le module Wan2.2 VACE Fun, puis augmente l'attention et la planification pour la stabilité. La branche HIGH passe par PathchSageAttentionKJ
(#8) et ModelSamplingSD3
(#57), tandis que la branche LOW utilise LoraLoaderModelOnly
(#61), PathchSageAttentionKJ
(#66), et ModelSamplingSD3
(#20). Cette division vous donne un passage précoce axé sur le détail et un raffinement axé sur le mouvement. Tous les choix de modèles sont pré-câblés ; vous exécutez simplement le graphe une fois vos paramètres et vos invites prêts.
WanVaceToVideo
(#43) injecte votre reference_image
, le conditionnement positif/négatif, et le VAE, puis génère une séquence vidéo latente initiale dimensionnée par width
, height
, et length
. Considérez cela comme le moment où l'image fixe "apprend" à se mouvoir selon votre invite. Le nœud retourne à la fois les flux de conditionnement pour réutilisation et un entier pour la découpe latente afin de garder le pipeline cohérent en trames. Aucun masque manuel ou vidéo de contrôle n'est requis à moins que vous ne souhaitiez expérimenter.
Une pile d'échantillonneurs en trois étapes façonne le résultat. Le premier passage KSamplerAdvanced
(#108) ensemence la séquence latente pour des indices de composition et de mouvement globaux. Le deuxième passage KSamplerAdvanced
(#107) approfondit le détail et la stabilité temporelle en utilisant le même conditionnement tout en préservant la mise en page de la scène. Le dernier passage KSamplerAdvanced
(#109) fonctionne sur la variante LOW pour polir le mouvement et réduire les artefacts, trouvant un équilibre pratique entre vitesse et qualité. TrimVideoLatent
(#65) aligne les trames sur la longueur cible avant le décodage.
VAEDecode
(#19) transforme les latents raffinés en trames RGB. VHS_VideoCombine
(#69) assemble ensuite ces trames en un MP4 à votre fps
choisi, en sauvegardant avec un schéma de nom de fichier sensé. Ce groupe est optimisé pour des boucles de révision rapide, afin que vous puissiez itérer sur les invites, la longueur ou la résolution sans toucher au reste du graphe. Lorsque vous êtes satisfait, gardez le même seed pour la répétabilité ou changez-le pour explorer des variations.
WanVaceToVideo
(#43)
Le cœur de Wan2.2 VACE Fun : il lie la sémantique des invites à votre image de référence et produit les latents vidéo initiaux. Ajustez width
, height
, et length
ici via les paramètres partagés pour correspondre à votre objectif créatif et budget VRAM. Gardez le sujet de référence centré et bien éclairé pour une meilleure rétention de l'identité. Si le mouvement semble erroné, révisez l'invite positive pour mettre en avant les actions, les mouvements de caméra, et les mots de timing.
KSamplerAdvanced
(#108, #107, #109)
Une chaîne d'échantillonneurs en étapes qui améliore progressivement la composition, le détail et la fluidité du mouvement. Augmentez steps
lorsque vous avez besoin de plus de détail ou de stabilité temporelle, et réutilisez le même seed
pour comparer équitablement les changements. Le dernier passage sur la variante LOW nettoie souvent des artefacts subtils ; si les résultats semblent trop doux, déplacez quelques étapes vers les passages précédents. sampling_shift
est exposé pour ajuster le calendrier soit vers l'accentuation du mouvement, soit vers une texture plus fine.
RMBG
(#73)
La suppression automatique de l'arrière-plan améliore l'adhérence au sujet pour Wan2.2 VACE Fun, notamment avec des scènes chargées ou à faible contraste. Utilisez des références de haute qualité, non floues, pour minimiser les erreurs de découpe. Si vous souhaitez des arrière-plans naturels, remplacez-les plus tard en post-production ou compositez une plaque derrière les trames décodées.
TrimVideoLatent
(#65)
Garde la séquence latente alignée sur la length
demandée. Si vous allongez ou raccourcissez un clip, laissez ce nœud gérer la comptabilité ; il prévient la dérive subtile des trames à travers les étapes de l'échantillonneur.
VHS_VideoCombine
(#69)
Encode les trames finales en MP4. Ajustez frame_rate
pour contrôler la durée du clip par rapport à length
(la durée équivaut aux trames divisées par fps). Augmentez la qualité pour la livraison finale ou réduisez-la pour des aperçus rapides ; une qualité supérieure augmente la taille du fichier et le temps d'encodage.
width
et height
cible pour éviter les étirements et les recadrages indésirables.length
et fps
en accord avec votre objectif : un fps plus élevé semble plus fluide mais raccourcit la durée totale pour le même nombre de trames.RMBG
et ajoutez une clause d'identité brève dans l'invite (vêtements, couleur ou équipement).Ce flux de travail implémente et s'appuie sur les travaux et ressources suivants. Nous remercions chaleureusement @BenjisAIPlayground pour le flux de travail "Wan2.2 VACE Fun Demo" et pour leurs contributions et entretien. Pour des détails autoritaires, veuillez vous référer à la documentation originale et aux dépôts liés ci-dessous.
Remarque : L'utilisation des modèles, ensembles de données et codes référencés est soumise aux licences et conditions respectives fournies par leurs auteurs et mainteneurs.
RunComfy est la première ComfyUI plateforme, offrant des ComfyUI en ligne environnement et services, ainsi que des workflows ComfyUI proposant des visuels époustouflants. RunComfy propose également AI Playground, permettant aux artistes d'utiliser les derniers outils d'IA pour créer des œuvres d'art incroyables.