Janus-Pro | Modello Text-to-Image + Image-to-Text

I nodi Janus-Pro e il suo flusso di lavoro associato sono completamente sviluppati da CY-CHENYUE. Diamo tutto il merito a CY-CHENYUE per questo lavoro innovativo. Sulla piattaforma RunComfy, stiamo semplicemente presentando i contributi di CY-CHENYUE alla comunità. È importante notare che attualmente non esiste alcuna connessione o partnership formale tra RunComfy e CY-CHENYUE. Apprezziamo profondamente il lavoro di CY-CHENYUE!

ComfyUI Janus-Pro Workflow

JanusPro | Text-to-Image + Image-to-Text Model

Want to run this workflow?

Fully operational workflows
No missing nodes or models
No manual setups required
Features stunning visuals

ComfyUI Janus-Pro Examples

januspro-text-to-image-image-to-text-model-1190-example_01.webp

januspro-text-to-image-image-to-text-model-1190-example_02.webp

januspro-text-to-image-image-to-text-model-1190-example_03.webp

januspro-text-to-image-image-to-text-model-1190-example_04.webp

januspro-text-to-image-image-to-text-model-1190-example_05.webp

januspro-text-to-image-image-to-text-model-1190-example_06.webp

januspro-text-to-image-image-to-text-model-1190-example_07.webp

januspro-text-to-image-image-to-text-model-1190-example_08.webp

januspro-text-to-image-image-to-text-model-1190-example_09.webp

januspro-text-to-image-image-to-text-model-1190-example_10.webp

Janus-Pro è un framework autoregressivo all'avanguardia che unifica la comprensione e la generazione multimodale, affrontando le principali limitazioni degli approcci precedenti. Separando la codifica visiva in percorsi distinti mantenendo un'unica architettura di trasformatori, Janus-Pro elimina i conflitti tra percezione e sintesi, migliorando sia la flessibilità che le prestazioni nell'IA multimodale. Con Janus-Pro, gli utenti possono ottenere un equilibrio più raffinato tra comprensione visiva e generazione di contenuti, rendendo Janus-Pro una scelta superiore per soluzioni di IA di nuova generazione.

Al centro del design di Janus-Pro c'è la sua strategia innovativa di codifica visiva a doppio percorso, che consente a Janus-Pro di elaborare gli input visivi in modo più efficace senza sacrificare le sue capacità generative. A differenza dei modelli unificati tradizionali che faticano a bilanciare comprensione e generazione, Janus-Pro ottimizza entrambi i compiti assegnando loro percorsi di codifica dedicati pur sfruttando un unico potente trasformatore per l'elaborazione. Questo approccio consente a Janus-Pro di adattarsi senza soluzione di continuità a una varietà di compiti multimodali, dalla sintesi di immagini alla generazione guidata dal testo, rafforzando la capacità di Janus-Pro di superare i framework IA esistenti.

Una grande sfida nei modelli multimodali unificati è mantenere alte prestazioni su un'ampia gamma di compiti senza richiedere architetture specifiche per compiti. Janus-Pro supera questo con il suo framework semplificato ma altamente adattabile, superando i modelli unificati precedenti e persino eguagliando o superando le prestazioni delle soluzioni specifiche per compiti. Con la sua semplicità, flessibilità e superiore efficacia, Janus-Pro rappresenta un passo significativo avanti nell'IA multimodale. Janus-Pro sta stabilendo un nuovo punto di riferimento per i modelli unificati di nuova generazione, dimostrando che Janus-Pro è il futuro della tecnologia IA multimodale.

1.1 Come utilizzare il flusso di lavoro di Janus-Pro?#

Puoi utilizzare il flusso di lavoro di Janus-Pro in 2 modi

Generazione di Immagini Janus-Pro
Descrizione Immagine Janus-Pro (OCR, didascalie, descrivere...ecc.)

1.2 Generazione di Immagini Janus-Pro#

Il Janus Image Generation Sampler ti consente di inserire prompt.
Puoi utilizzare il modello Janus-Pro-1B o Janus-Pro-7B.
La generazione di immagini Janus-Pro è attualmente limitata a un rapporto quadrato 1:1 (384*384 px).

I modelli Janus-Pro verranno scaricati automaticamente sulla tua macchina cloud runcomfy al primo avvio. Questo può richiedere 2-5 minuti al primo avvio. Link ai modelli -

Janus-Pro-1B - https://huggingface.co/deepseek-ai/Janus-Pro-1B
Janus-Pro-7B - https://huggingface.co/deepseek-ai/Janus-Pro-7B

I modelli verranno scaricati in : Comfyui/models/Janus-Pro

1.3 Descrizione Immagine Janus-Pro#

Clicca e carica un'immagine nel Nodo di Caricamento Immagine per l'elaborazione Janus-Pro.
Puoi eseguire: OCR, didascalie, descrizione dettagliata utilizzando il Nodo di Comprensione Immagine Janus-Pro. Basta digitare la tua richiesta nella casella di testo fornita nel nodo.

Esempio di domanda: "Descrivi questa immagine in dettaglio, dove si trova, cosa c'è scritto... ecc."

Janus-Pro stabilisce un nuovo standard per l'IA multimodale integrando senza soluzione di continuità comprensione e generazione all'interno di un framework unificato. L'innovativo encoding a doppio percorso di Janus-Pro migliora la flessibilità, risolvendo conflitti che ostacolano i modelli tradizionali. Superando le architetture unificate precedenti e rivaleggiando con soluzioni specifiche per compiti, Janus-Pro apre la strada a sistemi di IA più efficienti e versatili. Come framework potente e adattabile, Janus-Pro è all'avanguardia dell'intelligenza multimodale di nuova generazione, dimostrando che Janus-Pro è il futuro dell'IA multimodale.

Want More ComfyUI Workflows?

Stable Diffusion 3.5

Stable Diffusion 3.5 (SD3.5) per la generazione di immagini di alta qualità e diversificate.

Stable Diffusion 3.5 vs FLUX.1

Confronta Stable Diffusion 3.5 e FLUX.1 in un unico flusso di lavoro ComfyUI.

ComfyUI PhotoMakerV2 | Crea Foto Realistiche

Crea foto personalizzate realistiche da prompt testuali mantenendo l'identità

ComfyUI Img2Vid | Animazione di Morphing

Animazione di morphing con i moduli AnimateDiff LCM, IPAdapter, QRCode ControlNet e Custom Mask.

LTX-2 First Last Frame | Generatore di Video a Fotogrammi Chiave

Trasforma fotogrammi statici in transizioni video e sonore fluide in modo rapido.

AnimateDiff + Batch Prompt Schedule | Da testo a video

Batch Prompt schedule con AnimateDiff offre un controllo preciso sulla narrazione e sugli elementi visivi nella creazione di animazioni.

Creatore di Personaggi Coerenti

Crea design di personaggi coerenti e ad alta risoluzione da più angolazioni con pieno controllo su emozioni, illuminazione e ambienti.

LTX 2.3 Cozy Felt | Creatore di Testo in Video Morbido

Trasforma le tue idee in video in stile feltro fatti a mano senza sforzo.

Supporto

Risorse

Legale

RunComfy

RunComfy è la piattaforma principale ComfyUI che offre ComfyUI online ambiente e servizi, insieme a workflow di ComfyUI con visuali mozzafiato. RunComfy offre anche AI Models, consentire agli artisti di sfruttare gli ultimi strumenti di AI per creare arte incredibile.

Janus-Pro | Modello T2I + I2T