Description du Flux de Travail ComfyUI Wan 2.1
1. Qu'est-ce que Wan 2.1 ?
Le flux de travail ComfyUI Wan 2.1 est un pipeline de génération vidéo de pointe qui exploite les derniers modèles Wan 2.1 pour créer des vidéos de haute qualité à partir d'invites textuelles ou/et d'images de base. Wan 2.1 prend en charge la génération Texte-en-Vidéo (T2V) et Image-en-Vidéo (I2V), produisant des vidéos de 5 secondes avec un mouvement naturel et une qualité professionnelle. Wan 2.1 établit une nouvelle référence pour la génération vidéo par IA, surpassant les alternatives open-source et commerciales. Le modèle Wan 2.1 14B repousse les limites encore plus loin, offrant des résultats exceptionnels jusqu'à 720P.
2. Avantages et Capacités de Wan 2.1
- Sortie de haute qualité : Génère des vidéos de 480P à 720P avec un mouvement réaliste et des textures haute fidélité.
- Accessibilité matérielle : Le modèle léger Wan 2.1 1.3B nécessite seulement 8,19 Go de VRAM, le rendant compatible avec la plupart des GPU modernes (qui sont fournis par RunComfy ici!).
- Génération polyvalente : Wan 2.1 prend en charge à la fois les flux de travail Texte-en-Vidéo (T2V) et Image-en-Vidéo (I2V).
- Support multilingue : Wan 2.1 est le premier modèle vidéo capable de générer du texte en chinois et en anglais dans les vidéos.
- Efficacité VAE : Le backend Wan-VAE gère efficacement les vidéos en 1080P tout en préservant la cohérence temporelle.
- Traitement rapide : Le modèle Wan 2.1 1.3B fournit des résultats rapides tout en maintenant la qualité.
3. Comment Utiliser Wan 2.1
3.1 Méthodes de Génération Wan 2.1

Méthode de Génération Principale Wan 2.1 (désactivée par défaut) : Texte-en-Vidéo
- Entrées : Invite textuelle
- Idéal pour : Créer des vidéos à partir de zéro en utilisant des descriptions textuelles
- Caractéristiques :
- Utilise le modèle Wan 2.1 1.3B pour une génération plus rapide
- Crée des vidéos de 33 images (5 secondes) en résolution 480P
- Optimisé pour un mouvement fluide dans les courts clips

Méthode Avancée Wan 2.1 (activée par défaut) : Image-en-Vidéo avec Invite Textuelle
- Entrées : Image de base + invite textuelle
- Idéal pour : Animer des images fixes tout en guidant le mouvement avec une invite
- Caractéristiques :
- Préserve les éléments visuels de l'image d'entrée
- Permet un contrôle textuel sur la direction du mouvement
- Utilise le modèle Wan 2.1 14B pour une fidélité plus élevée
- Crée des vidéos de 33 images en résolution 512x512
Exemple de Flux de Travail :
- Dans CLIPTextEncode (Positive Prompt / Negative Prompt) : Entrez la description de votre scène (par exemple, "un renard se déplaçant rapidement dans un beau paysage hivernal avec des arbres et des montagnes pendant la journée, caméra en suivi").
- Dans Load Image : Téléchargez votre image de base.
- Pour un affinage supplémentaire (optionnel) :
- Dans KSampler : Ajustez
steps(par défaut : 30) pour un équilibre entre qualité et vitesse. - Dans ModelSamplingSD3 : Modifiez la valeur
scale(par défaut : 8) pour l'adhérence à l'invite.
- Dans KSampler : Ajustez
- Cliquez sur Queue Prompt pour démarrer la génération.
- Dans SaveAnimatedWEBP trouvez votre aperçu de sortie (également enregistré dans ComfyUI > Dossier de sortie).
3.2 Référence des Paramètres pour Wan 2.1
- KSampler :
steps: 20-30 (des valeurs plus élevées améliorent la qualité mais augmentent le temps)cfg: 6.0 (contrôle la force de l'adhérence à l'invite)scheduler: "simple" (détermine l'approche de planification du bruit)sampler_name: "uni_pc" (échantillonneur recommandé pour Wan 2.1) <p align="center"> <img src="https://cdn.runcomfy.net/workflow_assets/1199/readme03.webp" alt="Wan 2.1" width="350"/> </p>
- WanImageToVideo :
width/height: 512 (résolution de sortie)length: 33 (images par vidéo)batch_size: 1 (nombre de vidéos par exécution)
- ModelSamplingSD3 :
scale: 8 (contrôle l'adhérence au guidage)
- EmptyHunyuanLatentVideo :
width/height: 832/480 (résolution de sortie T2V)length: 33 (images par vidéo)batch_size: 1 (nombre de vidéos par exécution) <p align="center"> <img src="https://cdn.runcomfy.net/workflow_assets/1199/readme04.webp" alt="Wan 2.1" width="350"/> </p>
3.3 Optimisation Avancée avec Wan 2.1
- Optimisation de la Mémoire :
- Utilisez le modèle Wan 2.1 1.3B pour une génération plus rapide avec des exigences VRAM plus faibles.
- Réduisez la résolution (par exemple, 512x320) pour un traitement plus rapide.
- Diminuez le nombre d'images pour des rendus plus courts et plus rapides.
- Optimisation de la Qualité :
- Utilisez le modèle Wan 2.1 14B pour une sortie de meilleure qualité.
- Augmentez les étapes de KSampler à 30-40 pour des résultats plus affinés.
- Utilisez Image-en-Vidéo avec une image de base de haute qualité pour la meilleure fidélité.
Plus d'Informations
Pour des détails supplémentaires sur Wan 2.1, visitez le dépôt GitHub de Wan-Video.
Crédits
Le modèle Wan 2.1 a été développé par l'équipe Wan, et l'intégration ComfyUI a été créée par les développeurs originaux. Tout le crédit revient à ces innovateurs pour avoir fait progresser la génération vidéo par IA.

