logo
RunComfy
ComfyUIPlaygroundPricing
discord logo
ComfyUI>Flujos de trabajo>Janus-Pro | T2I + I2T Model

Janus-Pro | T2I + I2T Model

Workflow Name: RunComfy/JanusPro
Workflow ID: 0000...1190
Janus-Pro unifica la comprensión y generación multimodal con una codificación visual desacoplada para una mayor flexibilidad. Su diseño innovador supera a modelos anteriores, estableciendo un nuevo punto de referencia para la IA de próxima generación.

Janus-Pro es un marco autoregresivo de vanguardia que unifica la comprensión y generación multimodal, abordando limitaciones clave de enfoques anteriores. Al desacoplar la codificación visual en vías separadas mientras se mantiene una arquitectura de transformador única, Janus-Pro elimina conflictos entre percepción y síntesis, mejorando tanto la flexibilidad como el rendimiento en la IA multimodal. Con Janus-Pro, los usuarios pueden lograr un equilibrio más refinado entre la comprensión visual y la generación de contenido, haciendo de Janus-Pro una elección superior para soluciones de IA de próxima generación.

En el núcleo del diseño de Janus-Pro está su innovadora estrategia de codificación visual de doble vía, que permite a Janus-Pro procesar entradas visuales de manera más efectiva sin sacrificar sus capacidades generativas. A diferencia de los modelos unificados tradicionales que luchan por equilibrar la comprensión y la generación, Janus-Pro optimiza ambas tareas asignándoles vías de codificación dedicadas mientras sigue aprovechando un transformador único y poderoso para el procesamiento. Este enfoque permite a Janus-Pro adaptarse sin problemas a diversas tareas multimodales, desde la síntesis de imágenes hasta la generación guiada por texto, reforzando la capacidad de Janus-Pro para superar los marcos de IA existentes.

Un desafío importante en los modelos multimodales unificados es mantener un alto rendimiento en una amplia gama de tareas sin requerir arquitecturas específicas para cada tarea. Janus-Pro supera esto con su marco simplificado pero altamente adaptable, superando modelos unificados anteriores e incluso igualando o superando el rendimiento de soluciones específicas para tareas. Con su simplicidad, flexibilidad y efectividad superior, Janus-Pro representa un avance significativo en la IA multimodal. Janus-Pro está estableciendo un nuevo punto de referencia para modelos unificados de próxima generación, demostrando que Janus-Pro es el futuro de la tecnología IA multimodal.

1.1 ¿Cómo usar el flujo de trabajo de Janus-Pro?

Janus-Pro

Puedes usar el flujo de trabajo de Janus-Pro de 2 maneras

  1. Generación de imágenes Janus-Pro
  2. Descripción de imágenes Janus-Pro (OCR, Subtítulos, Describir...etc)

1.2 Generación de Imágenes Janus-Pro

Janus-Pro

  • El Muestrador de Generación de Imágenes Janus te permite ingresar indicaciones.
  • Puedes usar el modelo Janus-Pro-1B o Janus-Pro-7B.
  • La generación de imágenes Janus-Pro está actualmente restringida a una proporción Cuadrada 1:1 (384*384 px).

Los modelos Janus-Pro se descargarán automáticamente en tu máquina runcomfy cloud al ejecutarse por primera vez. Esto puede tardar de 2 a 5 minutos cuando se hace cola por primera vez. Enlaces de Modelos -

  • Janus-Pro-1B - https://huggingface.co/deepseek-ai/Janus-Pro-1B
  • Janus-Pro-7B - https://huggingface.co/deepseek-ai/Janus-Pro-7B

Los modelos se descargarán en : Comfyui/models/Janus-Pro

1.3 Descripción de Imágenes Janus-Pro

Janus-Pro

  • Haz clic y carga una imagen en el Nodo de Carga de Imágenes para el procesamiento de Janus-Pro.
  • Puedes realizar : OCR, Subtítulos, Descripción Detallada usando el Nodo de Comprensión de Imágenes Janus-Pro. Simplemente escribe tu solicitud en el Cuadro de Texto proporcionado en el nodo.

Ejemplo de Pregunta: “Describe esta imagen en detalle, ¿dónde se encuentra, qué está escrito en ella… etc.”


Janus-Pro establece un nuevo estándar para la IA multimodal al integrar sin problemas la comprensión y la generación dentro de un marco unificado. La innovadora codificación de doble vía de Janus-Pro mejora la flexibilidad, resolviendo conflictos que obstaculizan a los modelos tradicionales. Al superar arquitecturas unificadas anteriores y rivalizar con soluciones específicas de tareas, Janus-Pro allana el camino para sistemas de IA más eficientes y versátiles. Como un marco poderoso y adaptable, Janus-Pro se encuentra a la vanguardia de la inteligencia multimodal de próxima generación, demostrando que Janus-Pro es el futuro de la IA multimodal.

Want More ComfyUI Workflows?

Stable Diffusion 3.5

Stable Diffusion 3.5

Stable Diffusion 3.5 (SD3.5) para generación de imágenes de alta calidad y diversidad.

Stable Diffusion 3.5 vs FLUX.1

Stable Diffusion 3.5 vs FLUX.1

Compara Stable Diffusion 3.5 y FLUX.1 en un flujo de trabajo de ComfyUI.

ComfyUI PhotoMakerV2 | Crear Fotos Realistas

ComfyUI PhotoMakerV2 | Crear Fotos Realistas

Crea fotos personalizadas realistas a partir de indicaciones de texto mientras preservas la identidad

ComfyUI Vid2Vid Dance Transfer

Transfiere el movimiento y el estilo de un video fuente a una imagen u objeto objetivo.

MV-Adapter | Generador Multivista de Alta Resolución

Genera vistas de 360 grados de cualquier cosa a partir de una sola imagen o descripción.

Wan 2.2 | Líder en Generación de Video de Código Abierto

¡Disponible ahora! Mejor precisión + movimiento más suave.

Wan 2.1 LoRA

Mejora la generación de video Wan 2.1 con modelos LoRA para un estilo y personalización mejorados.

Wan 2.1 FLF2V | Video de Primer-Ultimo Fotograma

Genera videos fluidos a partir de un fotograma inicial y final usando Wan 2.1 FLF2V.

Síguenos
  • LinkedIn
  • Facebook
  • Instagram
  • Twitter
Soporte
  • Discord
  • Correo electrónico
  • Estado del sistema
  • afiliado
Recursos
  • ComfyUI en línea gratis
  • Guías de ComfyUI
  • RunComfy API
  • Tutoriales de ComfyUI
  • Nodos de ComfyUI
  • Aprende más
Legal
  • Términos de servicio
  • Política de privacidad
  • Política de cookies
RunComfy
Derechos de autor 2025 RunComfy. Todos los derechos reservados.

RunComfy es la principal ComfyUI plataforma, ofreciendo ComfyUI en línea entorno y servicios, junto con flujos de trabajo de ComfyUI con impresionantes imágenes. RunComfy también ofrece AI Playground, permitiendo a los artistas aprovechar las últimas herramientas de AI para crear arte increíble.