Janus-Pro | Text-to-Image + Image-to-Text Model

Los nodos de Janus-Pro y su flujo de trabajo asociado son completamente desarrollados por CY-CHENYUE. Damos todo el crédito debido a CY-CHENYUE por este trabajo innovador. En la plataforma RunComfy, simplemente estamos presentando las contribuciones de CY-CHENYUE a la comunidad. Es importante señalar que actualmente no hay una conexión formal o asociación entre RunComfy y CY-CHENYUE. ¡Apreciamos profundamente el trabajo de CY-CHENYUE!

ComfyUI Janus-Pro Workflow

JanusPro | Text-to-Image + Image-to-Text Model

Want to run this workflow?

Fully operational workflows
No missing nodes or models
No manual setups required
Features stunning visuals

ComfyUI Janus-Pro Examples

januspro-text-to-image-image-to-text-model-1190-example_01.webp

januspro-text-to-image-image-to-text-model-1190-example_02.webp

januspro-text-to-image-image-to-text-model-1190-example_03.webp

januspro-text-to-image-image-to-text-model-1190-example_04.webp

januspro-text-to-image-image-to-text-model-1190-example_05.webp

januspro-text-to-image-image-to-text-model-1190-example_06.webp

januspro-text-to-image-image-to-text-model-1190-example_07.webp

januspro-text-to-image-image-to-text-model-1190-example_08.webp

januspro-text-to-image-image-to-text-model-1190-example_09.webp

januspro-text-to-image-image-to-text-model-1190-example_10.webp

Janus-Pro es un marco autoregresivo de vanguardia que unifica la comprensión y generación multimodal, abordando limitaciones clave de enfoques anteriores. Al desacoplar la codificación visual en vías separadas mientras se mantiene una arquitectura de transformador única, Janus-Pro elimina conflictos entre percepción y síntesis, mejorando tanto la flexibilidad como el rendimiento en la IA multimodal. Con Janus-Pro, los usuarios pueden lograr un equilibrio más refinado entre la comprensión visual y la generación de contenido, haciendo de Janus-Pro una elección superior para soluciones de IA de próxima generación.

En el núcleo del diseño de Janus-Pro está su innovadora estrategia de codificación visual de doble vía, que permite a Janus-Pro procesar entradas visuales de manera más efectiva sin sacrificar sus capacidades generativas. A diferencia de los modelos unificados tradicionales que luchan por equilibrar la comprensión y la generación, Janus-Pro optimiza ambas tareas asignándoles vías de codificación dedicadas mientras sigue aprovechando un transformador único y poderoso para el procesamiento. Este enfoque permite a Janus-Pro adaptarse sin problemas a diversas tareas multimodales, desde la síntesis de imágenes hasta la generación guiada por texto, reforzando la capacidad de Janus-Pro para superar los marcos de IA existentes.

Un desafío importante en los modelos multimodales unificados es mantener un alto rendimiento en una amplia gama de tareas sin requerir arquitecturas específicas para cada tarea. Janus-Pro supera esto con su marco simplificado pero altamente adaptable, superando modelos unificados anteriores e incluso igualando o superando el rendimiento de soluciones específicas para tareas. Con su simplicidad, flexibilidad y efectividad superior, Janus-Pro representa un avance significativo en la IA multimodal. Janus-Pro está estableciendo un nuevo punto de referencia para modelos unificados de próxima generación, demostrando que Janus-Pro es el futuro de la tecnología IA multimodal.

1.1 ¿Cómo usar el flujo de trabajo de Janus-Pro?#

Puedes usar el flujo de trabajo de Janus-Pro de 2 maneras

Generación de imágenes Janus-Pro
Descripción de imágenes Janus-Pro (OCR, Subtítulos, Describir...etc)

1.2 Generación de Imágenes Janus-Pro#

El Muestrador de Generación de Imágenes Janus te permite ingresar indicaciones.
Puedes usar el modelo Janus-Pro-1B o Janus-Pro-7B.
La generación de imágenes Janus-Pro está actualmente restringida a una proporción Cuadrada 1:1 (384*384 px).

Los modelos Janus-Pro se descargarán automáticamente en tu máquina runcomfy cloud al ejecutarse por primera vez. Esto puede tardar de 2 a 5 minutos cuando se hace cola por primera vez. Enlaces de Modelos -

Janus-Pro-1B - https://huggingface.co/deepseek-ai/Janus-Pro-1B
Janus-Pro-7B - https://huggingface.co/deepseek-ai/Janus-Pro-7B

Los modelos se descargarán en : Comfyui/models/Janus-Pro

1.3 Descripción de Imágenes Janus-Pro#

Haz clic y carga una imagen en el Nodo de Carga de Imágenes para el procesamiento de Janus-Pro.
Puedes realizar : OCR, Subtítulos, Descripción Detallada usando el Nodo de Comprensión de Imágenes Janus-Pro. Simplemente escribe tu solicitud en el Cuadro de Texto proporcionado en el nodo.

Ejemplo de Pregunta: “Describe esta imagen en detalle, ¿dónde se encuentra, qué está escrito en ella… etc.”

Janus-Pro establece un nuevo estándar para la IA multimodal al integrar sin problemas la comprensión y la generación dentro de un marco unificado. La innovadora codificación de doble vía de Janus-Pro mejora la flexibilidad, resolviendo conflictos que obstaculizan a los modelos tradicionales. Al superar arquitecturas unificadas anteriores y rivalizar con soluciones específicas de tareas, Janus-Pro allana el camino para sistemas de IA más eficientes y versátiles. Como un marco poderoso y adaptable, Janus-Pro se encuentra a la vanguardia de la inteligencia multimodal de próxima generación, demostrando que Janus-Pro es el futuro de la IA multimodal.

Want More ComfyUI Workflows?

Stable Diffusion 3.5

Stable Diffusion 3.5 (SD3.5) para generación de imágenes de alta calidad y diversidad.

Stable Diffusion 3.5 vs FLUX.1

Compara Stable Diffusion 3.5 y FLUX.1 en un flujo de trabajo de ComfyUI.

ComfyUI PhotoMakerV2 | Crear Fotos Realistas

Crea fotos personalizadas realistas a partir de indicaciones de texto mientras preservas la identidad

LongCat Image Edit Turbo | Restilizador de fotos AI rápido en 8 pasos

Restilización instantánea de fotos con precisión cinematográfica y ajustes visuales rápidos.

Reemplazo de Personajes en Video (MoCha) | Herramienta de Intercambio Realista

Intercambia personajes de video rápidamente con control realista de movimiento e iluminación.

LBM Relighting | I2I

Ilumina sujetos usando entradas de iluminación basadas en imágenes con LBM.

ComfyUI + TouchDesigner | Visuales Reactivos al Audio

Renderiza visuales en ComfyUI y sincroniza el audio en TouchDesigner para obtener videos dinámicos y reactivos al audio.

Flux Klein Face Swap | Editor de Rostros AI Realista

Intercambia rostros perfectamente. Edición natural, realista y rápida impulsada por IA.

Soporte

Recursos

Legal

RunComfy

RunComfy es la principal ComfyUI plataforma, ofreciendo ComfyUI en línea entorno y servicios, junto con flujos de trabajo de ComfyUI con impresionantes imágenes. RunComfy también ofrece AI Models, permitiendo a los artistas aprovechar las últimas herramientas de AI para crear arte increíble.

Janus-Pro | T2I + I2T Model