ComfyUI>Workflows>OmniGen2 | Texte-à-Image & Édition

OmniGen2 | Texte-à-Image & Édition

Workflow Name: RunComfy/OmniGen2-Native

Workflow ID: 0000...1247

Découvrez la puissance de la génération multimodale unifiée d'OmniGen2 dans ComfyUI. Ce workflow utilise un modèle à 7 milliards de paramètres avec une architecture Transformer à double voie pour offrir une génération d'image à partir de texte exceptionnelle et une édition d'image guidée par texte. Basé sur la fondation Qwen 2.5 VL, OmniGen2 excelle dans la compréhension compositionnelle, le suivi de longues invites et les modifications d'image précises tout en maintenant la qualité et la cohérence visuelles.

Qu'est-ce que le Workflow OmniGen2 ComfyUI?

Le workflow OmniGen2 ComfyUI met la génération multimodale unifiée à portée de main, combinant la synthèse image-à-texte et l'édition d'image basée sur des instructions dans un cadre unique et puissant. Pensez-y comme un assistant IA créatif qui non seulement génère des images époustouflantes à partir de vos descriptions textuelles mais comprend également et exécute des commandes d'édition complexes avec une précision remarquable.

Ce workflow tire parti d'un modèle sophistiqué à 7 milliards de paramètres construit sur la fondation Qwen 2.5 VL, avec une architecture Transformer unique à double voie. Ce qui rend ce modèle spécial, c'est son design découplé - utilisant des voies séparées pour la génération de texte et d'image, lui permettant de maintenir une compréhension linguistique exceptionnelle tout en fournissant des sorties visuelles de haute fidélité qui restent fidèles à votre vision créative.

Caractéristiques Clés et Avantages d'OmniGen2

Modes de Génération Doubles: OmniGen2 crée de nouvelles images à partir de texte ou édite des images existantes avec des commandes en langage naturel via l'interface intuitive.

Architecture Avancée: Le design à double voie d'OmniGen2 sépare le traitement du texte et de l'image pour une performance optimale.

Compréhension Compositionnelle: OmniGen2 gère des invites complexes multi-éléments avec une précision exceptionnelle à chaque génération.

Édition d'Images Précise: Apportez des modifications ciblées tout en préservant parfaitement le reste de votre image grâce aux algorithmes avancés d'OmniGen2.

Réflexion Multimodale: OmniGen2 s'auto-analyse et affine les sorties pour des résultats améliorés.

Comment Utiliser OmniGen2 dans ComfyUI

Workflow Texte-à-Image OmniGen2

Définissez vos dimensions d'image

Utilisez le nœud EmptySD3LatentImage pour définir la taille de sortie pour OmniGen2:
- Ajustez la largeur et la hauteur en fonction de vos besoins OmniGen2
- Gardez batch_size à 1 pour la génération d'une seule image

Créez votre invite textuelle

Dans les nœuds CLIP Text Encode (Prompt) pour OmniGen2:
- Écrivez des invites détaillées et descriptives dans le premier encodeur
- Laissez le second encodeur vide ou ajoutez des invites négatives
- OmniGen2 excelle avec des descriptions compositionnelles complexes

Générez et enregistrez

Appuyez sur Run pour créer votre image OmniGen2
Le VAE Decode convertit les latents en image finale
Save Image enregistre automatiquement votre création OmniGen2 dans le dossier de sortie

Workflow d'Édition d'Image OmniGen2

Téléchargez votre image source

Utilisez le nœud Load Image pour importer l'image que vous souhaitez éditer avec OmniGen2

Rédigez votre instruction d'édition

Dans le nœud CLIP Text Encode (Prompt) pour OmniGen2:
- Décrivez clairement et spécifiquement les modifications que vous souhaitez
- Exemples: "Transformez la couleur des cheveux du personnage en blanc argenté naturel", "Ajoutez des lunettes de soleil aviateur"
- Les commandes en langage naturel fonctionnent parfaitement avec OmniGen2

Configurez les paramètres d'édition OmniGen2

Scale Image to Total Pixels nœud:
- upscale_method: area (maintient la qualité lors du redimensionnement)
- megapixels: 2.00 (contrôle le nombre total de pixels)
  - Cela redimensionne votre image à environ 2 millions de pixels au total
  - Par exemple: redimensionnerait une image 1920x1080 pour maintenir ~2MP
  - Des valeurs plus élevées = plus de détails mais traitement plus lent
  - Des valeurs plus basses = génération plus rapide mais moins de détails
  - 2.00 est optimal pour les capacités d'édition
VAE Encode convertit votre image redimensionnée en espace latent

Optionnel: Activer l'entrée de seconde image

Les nœuds violets (contournés) permettent des opérations multi-images:
- Appuyez sur Ctrl+B pour basculer le mode contournement
- Téléchargez une seconde image pour le transfert de style ou l'insertion d'objet
- Parfait pour des tâches comme "combiner des éléments de l'image 1 et de l'image 2"

Générez le résultat édité

Exécutez le workflow OmniGen2 pour voir vos modifications appliquées
Les résultats maintiennent une haute fidélité tout en suivant les instructions précisément

Remerciements

Ce workflow ComfyUI intègre le modèle révolutionnaire OmniGen2 développé par des chercheurs de l'Académie de l'Intelligence Artificielle de Pékin. Une reconnaissance spéciale va à l'équipe pour avoir créé ce système de génération multimodale unifiée qui repousse les limites de ce qui est possible avec un modèle à 7 milliards de paramètres. L'architecture représente une avancée significative dans l'équilibre entre l'efficacité du modèle et la qualité de génération.

Plus de Ressources sur OmniGen2

OmniGen2 est publié sous licence open-source, le rendant librement disponible pour des applications de recherche et commerciales. Pour plus d'informations sur OmniGen2:

Dépôt GitHub - Implémentation officielle et détails de l'architecture du modèle: VectorSpaceLab/OmniGen2
Page du Projet - Vue d'ensemble complète avec des démos et des insights techniques: Page Officielle
Exemples ComfyUI - Tutoriels étape par étape et workflows supplémentaires: Exemples ComfyUI

Want More ComfyUI Workflows?

FLUX Kontext Dev | Édition d'images intelligente

Kontext Dev = Contrôlable + Tous les besoins en conception graphique dans un seul outil

DreamO | Cadre Unifié de Personnalisation d'Image Multi-Tâches

Effectuez la génération d'image d'identité, de style, d'essayage, et multi-condition à partir de 1 à 3 références

BAGEL AI | T2I + I2T + I2I

Compréhension et génération multimodales avec une IA open-source.

Step1X-Edit | Outil d'Édition d'Images AI

Effectuez 11 opérations d'édition avec le langage naturel dans Step1X-Edit.

Cosmos-Predict2 | Text2Image & Video2World

Rapide et réel ! NVIDIA Cosmos avec une vraie physique.

SeedVR2 V2.5 | Workflow de Mise à l'Échelle Vidéo AI

Mettez à l'échelle les vidéos rapidement avec des résultats nets, fluides et cinématographiques.

VACE Wan2.1 | V2V

Transformez des vidéos avec une image de style de référence en utilisant VACE Wan2.1.

Contournement d'Image | Utilitaire de Flux de Travail de Contournement de Détection d'Image Intelligent

Évitez les limites et traitez les images plus rapidement avec un contrôle créatif total.

Support

Ressources

Légal

RunComfy

RunComfy est la première ComfyUI plateforme, offrant des ComfyUI en ligne environnement et services, ainsi que des workflows ComfyUI proposant des visuels époustouflants. RunComfy propose également AI Playground, permettant aux artistes d'utiliser les derniers outils d'IA pour créer des œuvres d'art incroyables.