Description du Flux de Travail ComfyUI Wan 2.1
1. Qu'est-ce que Wan 2.1 ?
Le flux de travail ComfyUI Wan 2.1 est un pipeline de génération vidéo de pointe qui exploite les derniers modèles Wan 2.1 pour créer des vidéos de haute qualité à partir d'invites textuelles ou/et d'images de base. Wan 2.1 prend en charge la génération Texte-en-Vidéo (T2V) et Image-en-Vidéo (I2V), produisant des vidéos de 5 secondes avec un mouvement naturel et une qualité professionnelle. Wan 2.1 établit une nouvelle référence pour la génération vidéo par IA, surpassant les alternatives open-source et commerciales. Le modèle Wan 2.1 14B repousse les limites encore plus loin, offrant des résultats exceptionnels jusqu'à 720P.
2. Avantages et Capacités de Wan 2.1
- Sortie de haute qualité : Génère des vidéos de 480P à 720P avec un mouvement réaliste et des textures haute fidélité.
- Accessibilité matérielle : Le modèle léger Wan 2.1 1.3B nécessite seulement 8,19 Go de VRAM, le rendant compatible avec la plupart des GPU modernes (qui sont fournis par RunComfy ici!).
- Génération polyvalente : Wan 2.1 prend en charge à la fois les flux de travail Texte-en-Vidéo (T2V) et Image-en-Vidéo (I2V).
- Support multilingue : Wan 2.1 est le premier modèle vidéo capable de générer du texte en chinois et en anglais dans les vidéos.
- Efficacité VAE : Le backend Wan-VAE gère efficacement les vidéos en 1080P tout en préservant la cohérence temporelle.
- Traitement rapide : Le modèle Wan 2.1 1.3B fournit des résultats rapides tout en maintenant la qualité.
3.1 Méthodes de Génération Wan 2.1

Méthode de Génération Principale Wan 2.1 (désactivée par défaut) : Texte-en-Vidéo
- Entrées : Invite textuelle
- Idéal pour : Créer des vidéos à partir de zéro en utilisant des descriptions textuelles
- Caractéristiques :
- Utilise le modèle Wan 2.1 1.3B pour une génération plus rapide
- Crée des vidéos de 33 images (5 secondes) en résolution 480P
- Optimisé pour un mouvement fluide dans les courts clips

Méthode Avancée Wan 2.1 (activée par défaut) : Image-en-Vidéo avec Invite Textuelle
- Entrées : Image de base + invite textuelle
- Idéal pour : Animer des images fixes tout en guidant le mouvement avec une invite
- Caractéristiques :
- Préserve les éléments visuels de l'image d'entrée
- Permet un contrôle textuel sur la direction du mouvement
- Utilise le modèle Wan 2.1 14B pour une fidélité plus élevée
- Crée des vidéos de 33 images en résolution 512x512
Exemple de Flux de Travail :
- Dans CLIPTextEncode (Positive Prompt / Negative Prompt) : Entrez la description de votre scène (par exemple, "un renard se déplaçant rapidement dans un beau paysage hivernal avec des arbres et des montagnes pendant la journée, caméra en suivi").
- Dans Load Image : Téléchargez votre image de base.
- Pour un affinage supplémentaire (optionnel) :
- Dans KSampler : Ajustez
steps
(par défaut : 30) pour un équilibre entre qualité et vitesse.
- Dans ModelSamplingSD3 : Modifiez la valeur
scale
(par défaut : 8) pour l'adhérence à l'invite.
- Cliquez sur Queue Prompt pour démarrer la génération.
- Dans SaveAnimatedWEBP trouvez votre aperçu de sortie (également enregistré dans ComfyUI > Dossier de sortie).
3.2 Référence des Paramètres pour Wan 2.1
- KSampler :
steps
: 20-30 (des valeurs plus élevées améliorent la qualité mais augmentent le temps)
cfg
: 6.0 (contrôle la force de l'adhérence à l'invite)
scheduler
: "simple" (détermine l'approche de planification du bruit)
sampler_name
: "uni_pc" (échantillonneur recommandé pour Wan 2.1)

- WanImageToVideo :
width/height
: 512 (résolution de sortie)
length
: 33 (images par vidéo)
batch_size
: 1 (nombre de vidéos par exécution)
- ModelSamplingSD3 :
scale
: 8 (contrôle l'adhérence au guidage)
- EmptyHunyuanLatentVideo :
width/height
: 832/480 (résolution de sortie T2V)
length
: 33 (images par vidéo)
batch_size
: 1 (nombre de vidéos par exécution)

3.3 Optimisation Avancée avec Wan 2.1
- Optimisation de la Mémoire :
- Utilisez le modèle Wan 2.1 1.3B pour une génération plus rapide avec des exigences VRAM plus faibles.
- Réduisez la résolution (par exemple, 512x320) pour un traitement plus rapide.
- Diminuez le nombre d'images pour des rendus plus courts et plus rapides.
- Optimisation de la Qualité :
- Utilisez le modèle Wan 2.1 14B pour une sortie de meilleure qualité.
- Augmentez les étapes de KSampler à 30-40 pour des résultats plus affinés.
- Utilisez Image-en-Vidéo avec une image de base de haute qualité pour la meilleure fidélité.
Pour des détails supplémentaires sur Wan 2.1, visitez le dépôt GitHub de Wan-Video.
Crédits
Le modèle Wan 2.1 a été développé par l'équipe Wan, et l'intégration ComfyUI a été créée par les développeurs originaux. Tout le crédit revient à ces innovateurs pour avoir fait progresser la génération vidéo par IA.