logo
RunComfy
ComfyUIPlaygroundPricing
discord logo
ComfyUI>Workflows>Janus-Pro | Modèle T2I + I2T

Janus-Pro | Modèle T2I + I2T

Workflow Name: RunComfy/JanusPro
Workflow ID: 0000...1190
Janus-Pro unifie la compréhension et la génération multimodales avec un encodage visuel découplé pour une flexibilité accrue. Son design innovant dépasse les modèles précédents, établissant un nouveau standard pour l'IA de prochaine génération.

Janus-Pro est un cadre autoregressif de pointe qui unifie la compréhension et la génération multimodales, en répondant aux principales limitations des approches précédentes. En découplant l'encodage visuel en voies séparées tout en maintenant une architecture de transformateur unique, Janus-Pro élimine les conflits entre la perception et la synthèse, améliorant à la fois la flexibilité et la performance dans l'IA multimodale. Avec Janus-Pro, les utilisateurs peuvent atteindre un équilibre plus raffiné entre la compréhension visuelle et la génération de contenu, faisant de Janus-Pro un choix supérieur pour les solutions d'IA de prochaine génération.

Au cœur du design de Janus-Pro se trouve sa stratégie d'encodage visuel à double voie innovante, qui permet à Janus-Pro de traiter les entrées visuelles plus efficacement sans sacrifier ses capacités génératives. Contrairement aux modèles unifiés traditionnels qui peinent à équilibrer compréhension et génération, Janus-Pro optimise les deux tâches en leur assignant des voies d'encodage dédiées tout en utilisant un transformateur unique et puissant pour le traitement. Cette approche permet à Janus-Pro de s'adapter sans effort à travers diverses tâches multimodales, de la synthèse d'image à la génération guidée par texte, renforçant la capacité de Janus-Pro à surpasser les cadres d'IA existants.

Un défi majeur dans les modèles multimodaux unifiés est de maintenir des performances élevées sur un large éventail de tâches sans nécessiter d'architectures spécifiques aux tâches. Janus-Pro surmonte cela avec son cadre simplifié mais hautement adaptable, surpassant les modèles unifiés précédents et égalant ou dépassant même les performances des solutions spécialisées. Avec sa simplicité, sa flexibilité et son efficacité supérieure, Janus-Pro représente un pas en avant significatif dans l'IA multimodale. Janus-Pro établit un nouveau standard pour les modèles unifiés de prochaine génération, prouvant que Janus-Pro est l'avenir de la technologie multimodale de l'IA.

1.1 Comment utiliser le flux de travail Janus-Pro ?

Janus-Pro

Vous pouvez utiliser le flux de travail Janus-Pro de 2 manières

  1. Génération d'image Janus-Pro
  2. Description d'image Janus-Pro (OCR, Légendes, Description...etc)

1.2 Génération d'image Janus-Pro

Janus-Pro

  • Le Sampler de génération d'image Janus vous permet de saisir des invites.
  • Vous pouvez utiliser le modèle Janus-Pro-1B ou Janus-Pro-7B.
  • La génération d'image Janus-Pro est actuellement limitée à un ratio carré 1:1 (384*384 px).

Les modèles Janus-Pro seront téléchargés automatiquement dans votre machine cloud runcomfy lors de la première exécution. Cela peut prendre 2 à 5 minutes lors de la première mise en file d'attente. Lien des modèles -

  • Janus-Pro-1B - https://huggingface.co/deepseek-ai/Janus-Pro-1B
  • Janus-Pro-7B - https://huggingface.co/deepseek-ai/Janus-Pro-7B

Les modèles seront téléchargés dans : Comfyui/models/Janus-Pro

1.3 Description d'image Janus-Pro

Janus-Pro

  • Cliquez et téléchargez une image dans le nœud de chargement d'image pour le traitement Janus-Pro.
  • Vous pouvez effectuer : OCR, Légendes, Description détaillée en utilisant le nœud de compréhension d'image Janus-Pro. Il suffit de taper votre demande dans la boîte de type fournie dans le nœud.

Exemple de question : "Décrivez cette image en détail, où se trouve-t-elle, qu'est-ce qui est écrit dessus… etc."


Janus-Pro établit un nouveau standard pour l'IA multimodale en intégrant de manière transparente la compréhension et la génération au sein d'un cadre unifié. L'encodage à double voie innovant de Janus-Pro améliore la flexibilité, résolvant les conflits qui entravent les modèles traditionnels. En surpassant les architectures unifiées précédentes et en rivalisant avec les solutions spécifiques aux tâches, Janus-Pro ouvre la voie à des systèmes d'IA plus efficaces et polyvalents. En tant que cadre puissant et adaptable, Janus-Pro se situe à l'avant-garde de l'intelligence multimodale de prochaine génération, prouvant que Janus-Pro est l'avenir de l'IA multimodale.

Want More ComfyUI Workflows?

Stable Diffusion 3.5

Stable Diffusion 3.5

Stable Diffusion 3.5 (SD3.5) pour une génération d'images de haute qualité et diverse.

Stable Diffusion 3.5 vs FLUX.1

Stable Diffusion 3.5 vs FLUX.1

Comparez Stable Diffusion 3.5 et FLUX.1 dans un seul flux de travail ComfyUI.

ComfyUI PhotoMakerV2 | Créer des Photos Réalistes

ComfyUI PhotoMakerV2 | Créer des Photos Réalistes

Créez des photos personnalisées réalistes à partir de prompts textuels tout en préservant l'identité

Wan Alpha | Générateur de vidéos transparentes

Magie de l'alpha : vidéos à arrière-plan transparent instantané pour VFX et design.

AnimateDiff + ControlNet TimeStep KeyFrame | Animation de morphing

Définissez des images clés ControlNet Timestep, telles que les premières et dernières images, pour créer des animations de morphing.

ByteDance USO | Générateur de style et de sujet unifié

ByteDance USO rend la fusion de sujet et de style simple et puissante.

InfiniteYou | Génération de Visages avec Préservation de l'Identité

Génération à double mode avec préservation de l'identité grâce aux workflows Face Combine et Zero-Shot utilisant InfiniteYou.

ComfyUI Img2Vid | Animation Morphing

Animation morphing avec les modules AnimateDiff LCM, IPAdapter, QRCode ControlNet et Custom Mask.

Suivez-nous
  • LinkedIn
  • Facebook
  • Instagram
  • Twitter
Support
  • Discord
  • Email
  • État du système
  • affilié
Ressources
  • ComfyUI en ligne gratuit
  • Guides ComfyUI
  • RunComfy API
  • Tutoriels ComfyUI
  • Nœuds ComfyUI
  • En savoir plus
Légal
  • Conditions d'utilisation
  • Politique de confidentialité
  • Politique relative aux cookies
RunComfy
Droits d'auteur 2025 RunComfy. Tous droits réservés.

RunComfy est la première ComfyUI plateforme, offrant des ComfyUI en ligne environnement et services, ainsi que des workflows ComfyUI proposant des visuels époustouflants. RunComfy propose également AI Playground, permettant aux artistes d'utiliser les derniers outils d'IA pour créer des œuvres d'art incroyables.