Janus-Pro | Modèle Texte-à-Image + Image-à-Texte

Les nœuds Janus-Pro et son flux de travail associé sont entièrement développés par CY-CHENYUE. Nous donnons tout le crédit dû à CY-CHENYUE pour ce travail innovant. Sur la plateforme RunComfy, nous présentons simplement les contributions de CY-CHENYUE à la communauté. Il est important de noter qu'il n'y a actuellement aucune connexion formelle ou partenariat entre RunComfy et CY-CHENYUE. Nous apprécions profondément le travail de CY-CHENYUE !

ComfyUI Janus-Pro Workflow

JanusPro | Text-to-Image + Image-to-Text Model

Want to run this workflow?

Fully operational workflows
No missing nodes or models
No manual setups required
Features stunning visuals

ComfyUI Janus-Pro Examples

januspro-text-to-image-image-to-text-model-1190-example_01.webp

januspro-text-to-image-image-to-text-model-1190-example_02.webp

januspro-text-to-image-image-to-text-model-1190-example_03.webp

januspro-text-to-image-image-to-text-model-1190-example_04.webp

januspro-text-to-image-image-to-text-model-1190-example_05.webp

januspro-text-to-image-image-to-text-model-1190-example_06.webp

januspro-text-to-image-image-to-text-model-1190-example_07.webp

januspro-text-to-image-image-to-text-model-1190-example_08.webp

januspro-text-to-image-image-to-text-model-1190-example_09.webp

januspro-text-to-image-image-to-text-model-1190-example_10.webp

Janus-Pro est un cadre autoregressif de pointe qui unifie la compréhension et la génération multimodales, en répondant aux principales limitations des approches précédentes. En découplant l'encodage visuel en voies séparées tout en maintenant une architecture de transformateur unique, Janus-Pro élimine les conflits entre la perception et la synthèse, améliorant à la fois la flexibilité et la performance dans l'IA multimodale. Avec Janus-Pro, les utilisateurs peuvent atteindre un équilibre plus raffiné entre la compréhension visuelle et la génération de contenu, faisant de Janus-Pro un choix supérieur pour les solutions d'IA de prochaine génération.

Au cœur du design de Janus-Pro se trouve sa stratégie d'encodage visuel à double voie innovante, qui permet à Janus-Pro de traiter les entrées visuelles plus efficacement sans sacrifier ses capacités génératives. Contrairement aux modèles unifiés traditionnels qui peinent à équilibrer compréhension et génération, Janus-Pro optimise les deux tâches en leur assignant des voies d'encodage dédiées tout en utilisant un transformateur unique et puissant pour le traitement. Cette approche permet à Janus-Pro de s'adapter sans effort à travers diverses tâches multimodales, de la synthèse d'image à la génération guidée par texte, renforçant la capacité de Janus-Pro à surpasser les cadres d'IA existants.

Un défi majeur dans les modèles multimodaux unifiés est de maintenir des performances élevées sur un large éventail de tâches sans nécessiter d'architectures spécifiques aux tâches. Janus-Pro surmonte cela avec son cadre simplifié mais hautement adaptable, surpassant les modèles unifiés précédents et égalant ou dépassant même les performances des solutions spécialisées. Avec sa simplicité, sa flexibilité et son efficacité supérieure, Janus-Pro représente un pas en avant significatif dans l'IA multimodale. Janus-Pro établit un nouveau standard pour les modèles unifiés de prochaine génération, prouvant que Janus-Pro est l'avenir de la technologie multimodale de l'IA.

1.1 Comment utiliser le flux de travail Janus-Pro ?#

Vous pouvez utiliser le flux de travail Janus-Pro de 2 manières

Génération d'image Janus-Pro
Description d'image Janus-Pro (OCR, Légendes, Description...etc)

1.2 Génération d'image Janus-Pro#

Le Sampler de génération d'image Janus vous permet de saisir des invites.
Vous pouvez utiliser le modèle Janus-Pro-1B ou Janus-Pro-7B.
La génération d'image Janus-Pro est actuellement limitée à un ratio carré 1:1 (384*384 px).

Les modèles Janus-Pro seront téléchargés automatiquement dans votre machine cloud runcomfy lors de la première exécution. Cela peut prendre 2 à 5 minutes lors de la première mise en file d'attente. Lien des modèles -

Janus-Pro-1B - https://huggingface.co/deepseek-ai/Janus-Pro-1B
Janus-Pro-7B - https://huggingface.co/deepseek-ai/Janus-Pro-7B

Les modèles seront téléchargés dans : Comfyui/models/Janus-Pro

1.3 Description d'image Janus-Pro#

Cliquez et téléchargez une image dans le nœud de chargement d'image pour le traitement Janus-Pro.
Vous pouvez effectuer : OCR, Légendes, Description détaillée en utilisant le nœud de compréhension d'image Janus-Pro. Il suffit de taper votre demande dans la boîte de type fournie dans le nœud.

Exemple de question : "Décrivez cette image en détail, où se trouve-t-elle, qu'est-ce qui est écrit dessus… etc."

Janus-Pro établit un nouveau standard pour l'IA multimodale en intégrant de manière transparente la compréhension et la génération au sein d'un cadre unifié. L'encodage à double voie innovant de Janus-Pro améliore la flexibilité, résolvant les conflits qui entravent les modèles traditionnels. En surpassant les architectures unifiées précédentes et en rivalisant avec les solutions spécifiques aux tâches, Janus-Pro ouvre la voie à des systèmes d'IA plus efficaces et polyvalents. En tant que cadre puissant et adaptable, Janus-Pro se situe à l'avant-garde de l'intelligence multimodale de prochaine génération, prouvant que Janus-Pro est l'avenir de l'IA multimodale.

Want More ComfyUI Workflows?

Stable Diffusion 3.5

Stable Diffusion 3.5 (SD3.5) pour une génération d'images de haute qualité et diverse.

Stable Diffusion 3.5 vs FLUX.1

Comparez Stable Diffusion 3.5 et FLUX.1 dans un seul flux de travail ComfyUI.

ComfyUI PhotoMakerV2 | Créer des Photos Réalistes

Créez des photos personnalisées réalistes à partir de prompts textuels tout en préservant l'identité

AnimateDiff + QR Code ControlNet | Effets visuels (VFX)

Créez des effets visuels captivants avec AnimateDiff et ControlNet (avec QRCode Monster et Lineart).

ACE-Step 1.5XL Base texte en musique | Générateur de son AI

Transforme votre texte en musique entièrement créée par IA instantanément.

ComfyUI Grounding | Workflow de Suivi d'Objets

Suivez n'importe quel sujet avec une précision au pixel près pour des résultats VFX époustouflants.

SDXL LoRA Inférence | AI Toolkit ComfyUI

Exécutez votre SDXL LoRA formé avec AI Toolkit dans ComfyUI avec des paramètres par défaut correspondant à l'entraînement à l'aide d'un seul nœud personnalisé RC.

InfiniteTalk | Générateur d'Avatar Synchronisé sur les Lèvres

Photo + Voix = Avatar Parlant Parfaitement Synchronisé en Minutes

Support

Ressources

Légal

RunComfy

RunComfy est la première ComfyUI plateforme, offrant des ComfyUI en ligne environnement et services, ainsi que des workflows ComfyUI proposant des visuels époustouflants. RunComfy propose également AI Models, permettant aux artistes d'utiliser les derniers outils d'IA pour créer des œuvres d'art incroyables.

Janus-Pro | Modèle T2I + I2T