logo
RunComfy
ComfyUIPlaygroundPricing
discord logo
ComfyUI>Workflows>SVD (Stable Video Diffusion) + SD | Texte vers Vidéo

SVD (Stable Video Diffusion) + SD | Texte vers Vidéo

Workflow Name: RunComfy/SVD
Workflow ID: 0000...1020
Dans ce workflow ComfyUI, nous intégrons les processus Stable Diffusion de texte à image et Stable Video Diffusion d'image à vidéo. Cela vous permet de saisir du texte pour générer une image, qui peut ensuite être convertie de manière transparente en vidéo.

1. Workflow ComfyUI Stable Video Diffusion (SVD)

Le workflow ComfyUI intègre de manière transparente les technologies de texte à image (Stable Diffusion) et d'image à vidéo (Stable Video Diffusion) pour une conversion efficace du texte à la vidéo. Ce workflow vous permet de générer des vidéos directement à partir de descriptions textuelles, en commençant par une image de base qui évolue en une séquence vidéo dynamique. Ce workflow facilite la réalisation d'animations ou de vidéos de texte à vidéo.

2. Aperçu de Stable Video Diffusion (SVD)

2.1. Introduction à Stable Video Diffusion (SVD)

Stable Video Diffusion (SVD) est une technologie de pointe développée pour convertir des images statiques en contenu vidéo dynamique. S'appuyant sur le modèle d'image Stable Diffusion, SVD introduit du mouvement aux images fixes, facilitant la création de brefs clips vidéo. Cette avancée dans les modèles de diffusion latente, initialement conçus pour la synthèse d'images, intègre désormais des dimensions temporelles pour animer des visuels fixes, produisant des vidéos généralement dans la plage de 2 à 5 secondes.

Stable Video Diffusion est disponible en deux variantes : le SVD standard, capable de générer des vidéos à une résolution de 576×1024 pixels sur 14 images, et le SVD-XT amélioré, qui peut produire jusqu'à 25 images. Les deux variantes prennent en charge des fréquences d'images ajustables de 3 à 30 images par seconde, répondant à diverses exigences de création de contenu numérique.

L'entraînement du modèle SVD implique un processus en trois étapes : commençant par un modèle d'image, passant à un modèle vidéo pré-entraîné avec un vaste ensemble de données vidéo, et affiné avec une sélection de clips vidéo de haute qualité. Ce processus méticuleux met en évidence l'importance de la qualité de l'ensemble de données dans l'optimisation des capacités de production vidéo du modèle.

Au cœur du modèle Stable Video Diffusion se trouve le modèle d'image Stable Diffusion 2.1, qui agit comme l'épine dorsale de l'image de base. L'intégration de couches de convolution et d'attention temporelles dans l'estimateur de bruit U-Net fait évoluer ceci en un puissant modèle vidéo, interprétant les tenseurs latents comme des séquences vidéo. Ce modèle utilise une diffusion inverse pour débruiter simultanément toutes les images, à l'instar du modèle VideoLDM.

Doté de 1,5 milliard de paramètres et entraîné sur un vaste ensemble de données vidéo, le modèle subit un affinement supplémentaire avec un ensemble de données vidéo de haute qualité pour des performances optimales. Deux ensembles de poids de modèle SVD sont accessibles au public, conçus pour générer des vidéos de 14 et 25 images à une résolution de 576×1024, respectivement.

2.2. Caractéristiques clés de Stable Video Diffusion (SVD)

Lors de l'utilisation de Stable Video Diffusion dans le workflow ComfyUI, vous pouvez ajuster les paramètres clés pour la personnalisation de la sortie vidéo, notamment l'bucket id de mouvement, contrôlant l'intensité du mouvement de la vidéo ; les images par seconde (fps), déterminant la fréquence d'images ; et le niveau d'augmentation, ajustant le niveau de bruit de l'image initiale pour divers degrés de transformation.

2.2.1. Bucket ID de Mouvement : Cette fonctionnalité offre aux utilisateurs la possibilité de contrôler l'intensité du mouvement de la vidéo. En ajustant ce paramètre, vous pouvez dicter la quantité de mouvement observée dans la vidéo, allant de gestes subtils à une action plus prononcée, en fonction de l'effet visuel souhaité.

2.2.2. Images Par Seconde (fps) : Ce paramètre est crucial pour déterminer la vitesse de lecture de la vidéo. L'ajustement des images par seconde vous permet de produire des vidéos qui peuvent capturer la dynamique rapide d'une scène ou présenter un effet de ralenti, améliorant ainsi l'aspect narratif du contenu vidéo. Cette flexibilité est particulièrement bénéfique pour créer un large éventail de types de vidéos, des publicités au rythme effréné aux pièces plus contemplatives et narratives.

2.2.3. Paramètre de Niveau d'Augmentation : Cela ajuste le niveau de bruit de l'image initiale, permettant divers degrés de transformation. En manipulant ce paramètre, vous pouvez contrôler la mesure dans laquelle l'image d'origine est modifiée pendant le processus de création de la vidéo. L'ajustement du niveau d'augmentation permet de maintenir une fidélité plus étroite à l'image d'origine ou de s'aventurer dans des interprétations plus abstraites et artistiques, élargissant ainsi les possibilités créatives.

Want More ComfyUI Workflows?

SVD + FreeU | Image vers Vidéo

Incorporez FreeU avec SVD pour améliorer la qualité de conversion d'image en vidéo sans coûts supplémentaires.

SVD + IPAdapter V1 | Image vers Vidéo

Utilisez IPAdapters pour la génération d'images statiques et Stable Video Diffusion pour la génération dynamique de vidéos.

FlashVSR | Agrandisseur vidéo en temps réel

Agrandissez les vidéos rapidement, en douceur, et super claires—aucun détail perdu.

IPAdapter Plus (V2) | Fusionner des images

IPAdapter Plus (V2) | Fusionner des images

Utilisez diverses méthodes de fusion avec IPAdapter Plus pour un contrôle précis et efficace du mélange d'images.

PMRF Ultra Rapide Upscaler | Low VRAM ComfyUI

Agrandisseur PMRF ultra rapide ! 3,79s sur une machine moyenne. Échelle 2x.

Era3D | ComfyUI 3D Pack

Era3D | ComfyUI 3D Pack

Générez du contenu 3D, des images multi-vues aux maillages détaillés.

Flux Fill | Inpainting et Outpainting

Outils Flux officiels - Flux Fill pour l'inpainting et l'outpainting

AnimateDiff + Batch Prompt Schedule | Texte à Vidéo

Utilisez Prompts Travel avec Animatediff pour un contrôle précis des images spécifiques dans l'animation.

Suivez-nous
  • LinkedIn
  • Facebook
  • Instagram
  • Twitter
Support
  • Discord
  • Email
  • État du système
  • affilié
Ressources
  • ComfyUI en ligne gratuit
  • Guides ComfyUI
  • RunComfy API
  • Tutoriels ComfyUI
  • Nœuds ComfyUI
  • En savoir plus
Légal
  • Conditions d'utilisation
  • Politique de confidentialité
  • Politique relative aux cookies
RunComfy
Droits d'auteur 2025 RunComfy. Tous droits réservés.

RunComfy est la première ComfyUI plateforme, offrant des ComfyUI en ligne environnement et services, ainsi que des workflows ComfyUI proposant des visuels époustouflants. RunComfy propose également AI Playground, permettant aux artistes d'utiliser les derniers outils d'IA pour créer des œuvres d'art incroyables.