Wan2.2 Fun Inp transforme deux images fixes en une vidéo cohérente en guidant le modèle d’un premier cadre à un dernier cadre avec une interpolation naturelle entre les deux. Il est conçu pour les artistes, les animateurs et les cinéastes qui veulent une cohérence cinématique tout en conservant le contrôle par invite. Le flux de travail est livré avec deux préréglages parallèles afin que vous puissiez privilégier soit une synthèse ultra-rapide en 4 étapes, soit une génération plus générale échelonnée en fp8, toutes deux alimentées par Wan 2.2 Fun Inpaint.
Wan2.2 Fun Inp transforme deux images fixes en une vidéo cohérente en guidant le modèle d’un premier cadre à un dernier cadre avec une interpolation naturelle entre les deux. Il est conçu pour les artistes, les animateurs et les cinéastes qui veulent une cohérence cinématique tout en conservant le contrôle par invite. Le flux de travail est livré avec deux préréglages parallèles afin que vous puissiez privilégier soit une synthèse ultra-rapide en 4 étapes, soit une génération plus générale échelonnée en fp8, toutes deux alimentées par Wan 2.2 Fun Inpaint.
Wan 2.2 Fun Inpaint 14B (fp8 échelonné)
L’épine dorsale principale de diffusion spécialisée pour la génération vidéo “Fun Inpaint”. Deux variantes sont incluses : haut bruit pour des mouvements plus larges et des transitions créatives, et faible bruit lorsque vous avez besoin de maintenir une fidélité plus étroite à vos cadres de départ/fin.
• Haut bruit :
• Faible bruit :
Lightning 4-Step LoRA pour I2V
Un LoRA optionnel qui compresse le calendrier d’échantillonnage à seulement quatre étapes pour une itération rapide, idéal pour les aperçus et les brouillons rapides.
• LoRA faible bruit :
• LoRA haut bruit :
Wan VAE
Le VAE gère les conversions latent–pixel utilisées par les modèles Wan; il préserve les détails et la tonalité pendant le décodage/encodage. Voir le package Wan 2.2 sur .
Encodeur de texte CLIP
Encode vos invites positives et négatives en vecteurs de conditionnement qui orientent le récit visuel. Implémentation de référence : .
Suite d'aide vidéo ComfyUI (export)
Combine les cadres générés en un MP4 à votre taux de trame choisi. Rép. : .
Le graphe contient deux groupes parallèles que vous pouvez basculer en fonction de la vitesse par rapport à la généralité. Activez seulement un à la fois pour des exécutions propres.
Utilisez ceci pour des aperçus très rapides. Le groupe charge l’épine dorsale Wan 2.2 plus un Lightning 4-Step LoRA et dirige vos invites à travers le chemin de l’échantillonneur court. Fournissez vos images de départ et de fin, puis ajustez les paramètres de haut niveau selon les besoins. En interne, WanFunInpaintToVideo
(#111) ensemence la trajectoire du premier au dernier cadre, tandis qu’un échantillonneur court affine le mouvement et la structure en quelques étapes.
Choisissez ceci lorsque vous voulez une gamme d’opérations plus large sans la contrainte de 4 étapes. Ce chemin utilise directement le modèle Wan 2.2 échelonné en fp8, maintenant le même guidage de premier à dernier cadre mais avec un budget d’échantillonneur standard pour une récupération de détail plus nuancée et une mise en forme du mouvement. Le nœud WanFunInpaintToVideo
(#148) ancre la trajectoire et passe au sampler en aval pour le raffinement.
Les deux groupes incluent une section Téléchargez les images de départ et de fin. Branchez une image de départ qui définit la composition d’ouverture et une image de fin qui définit la pose ou la scène finale. Le flux de travail interpolera le mouvement et l’apparence entre eux, respectant vos invites textuelles. Pour de meilleurs résultats, gardez le rapport d’aspect cohérent entre les deux images.
Écrivez ce que vous voulez voir dans l’Invite Positive et ce que vous voulez éviter dans l’Invite Négative. Les nœuds CLIP Text Encode (Positive Prompt)
et CLIP Text Encode (Negative Prompt)
transforment votre texte en conditionnement qui dirige le contenu, le style et la dynamique. Utilisez des phrases concises et orientées scène (actions, indices de caméra, matériaux, ambiance) plutôt que de longues listes.
Définissez largeur
, hauteur
et longueur
dans le nœud WanFunInpaintToVideo
pour définir la résolution spatiale et le nombre de cadres. Les valeurs par défaut sont réglées pour une vidéo haute de 576×1024 avec environ 3–4 secondes de mouvement à 24 fps. Les séquences plus longues bénéficient généralement du chemin échelonné en fp8; les aperçus courts sont excellents avec le groupe 4 étapes LoRA.
VHS_VideoCombine
assemble les cadres en un MP4 avec un 24 fps par défaut et un CRF favorable à la qualité. Les noms de fichiers sont préfixés pour chaque branche (par exemple, Fun_Inp
et Fun_Inp_4_Step
) afin que vous puissiez comparer facilement les sorties. Ajustez le taux de trame si vous avez besoin d’une lecture plus lente ou plus rapide.
Sélectionnez un groupe et utilisez Ctrl+B pour l’activer ou le désactiver. Si vous activez le groupe fp8_scaled, désactivez le groupe fp8_scaled + 4 étapes LoRA, et vice versa. Vous pouvez également utiliser les fonctionnalités d’exécution partielle de ComfyUI pour exécuter uniquement les sections que vous modifiez.
WanFunInpaintToVideo
(#111 et #148)Le moteur principal qui mélange votre image_départ et image_fin en une trajectoire latente continue. Il accepte largeur
, hauteur
, et longueur
pour définir la taille et la durée de la vidéo, puis émet une séquence latente plus un conditionnement positif/négatif mis à jour. Commencez ici lorsque vous ajustez la continuité, le rythme ou la composition à travers le plan.
UNETLoader
(#101, #102)Choisit la variante du modèle Wan 2.2 Fun Inpaint. Utilisez haut bruit pour des mouvements plus audacieux et des interpolations plus transformatrices. Utilisez faible bruit lorsque la préservation de l’identité et de la texture des cadres de départ et de fin est la priorité. Associez l’un ou l’autre avec ou sans le 4 étapes LoRA selon les besoins de vitesse.
ModelSamplingSD3
(#93)Configure le calendrier de l’échantillonneur utilisé en aval. Gardez-le aligné avec le LoRA ou le chemin fp8 choisi. Si vous voyez un scintillement temporel, des ajustements modestes au mode de l’échantillonneur ou aux étapes peuvent lisser les transitions sans trop affiner les détails.
KSamplerAdvanced
(#150)Applique un passage de raffinement à la séquence latente. Augmentez légèrement les étapes si vous avez besoin de micro-détails plus nets sur les visages, les mains ou les structures fines; réduisez les étapes pour un mouvement plus doux et plus rêveur. Évitez les valeurs CFG ou les nombres d’étapes extrêmes qui peuvent déstabiliser la cohérence temporelle.
VHS_VideoCombine
(#159)Fusionne les cadres rendus en MP4. Ajustez frame_rate
pour la sensation de mouvement et la vitesse de lecture, et gardez le pix_fmt
par défaut pour une compatibilité large avec les lecteurs. Un CRF plus bas produit des fichiers plus grands avec des gradients plus fins; un CRF plus élevé compresse de manière plus agressive.
largeur
×hauteur
sélectionnée pour réduire les recadrages ou déformations indésirables.Le flux de travail Wan 2.2 Inp Fun élargit les possibilités créatives de la génération vidéo par IA en reliant le contrôle de cadre de début à fin avec une interpolation naturelle. C’est un outil polyvalent pour les artistes, animateurs et cinéastes qui veulent une cohérence cinématique dans leurs projets pilotés par IA.
Remerciements particuliers aux équipes ComfyUI et Wan pour avoir permis une intégration fluide du flux de travail Inp Fun dans les pipelines créatifs de nouvelle génération.
RunComfy est la première ComfyUI plateforme, offrant des ComfyUI en ligne environnement et services, ainsi que des workflows ComfyUI proposant des visuels époustouflants. RunComfy propose également AI Playground, permettant aux artistes d'utiliser les derniers outils d'IA pour créer des œuvres d'art incroyables.