OmniGen2 ComfyUI Workflow | Generación Unificada de Texto a Imagen

ComfyUI OmniGen2 Workflow

OmniGen2 ComfyUI Workflow | Unified Text-to-Image Generation

Want to run this workflow?

Fully operational workflows
No missing nodes or models
No manual setups required
Features stunning visuals

ComfyUI OmniGen2 Examples

omnigen2-comfyui-workflow-unified-text-to-image-generation-1247-example_01.webp

omnigen2-comfyui-workflow-unified-text-to-image-generation-1247-example_02.webp

omnigen2-comfyui-workflow-unified-text-to-image-generation-1247-example_03.webp

omnigen2-comfyui-workflow-unified-text-to-image-generation-1247-example_04.webp

¿Qué es el Flujo de Trabajo OmniGen2 ComfyUI?#

El flujo de trabajo OmniGen2 ComfyUI lleva la generación multimodal unificada a tus manos, combinando síntesis de texto a imagen y edición de imagen basada en instrucciones en un marco único y poderoso. Piensa en ello como tener un asistente de IA creativo que no solo genera imágenes impresionantes a partir de tus descripciones de texto, sino que también entiende y ejecuta comandos de edición complejos con una precisión notable.

Este flujo de trabajo aprovecha un sofisticado modelo de 7B parámetros construido sobre la base Qwen 2.5 VL, con una arquitectura única de Transformer de doble vía. Lo que hace especial a este modelo es su diseño desacoplado - utilizando caminos separados para generación de texto e imagen, permitiéndole mantener una comprensión excepcional del lenguaje mientras ofrece salidas visuales de alta fidelidad que son fieles a tu visión creativa.

Características y Beneficios Clave de OmniGen2#

Modos de Generación Dual: OmniGen2 crea nuevas imágenes a partir de texto o edita las existentes con comandos de lenguaje natural a través de la interfaz intuitiva.

Arquitectura Avanzada: El diseño de doble vía de OmniGen2 separa el procesamiento de texto e imagen para un rendimiento óptimo.

Comprensión Composicional: OmniGen2 maneja indicaciones complejas de múltiples elementos con una precisión excepcional en cada generación.

Edición Precisa de Imágenes: Realiza cambios específicos mientras preserva el resto de tu imagen perfectamente usando algoritmos avanzados de OmniGen2.

Reflexión Multimodal: OmniGen2 se autoanaliza y refina salidas para mejorar los resultados.

Cómo Usar OmniGen2 en ComfyUI#

Flujo de Trabajo de Texto a Imagen de OmniGen2#

Configura las dimensiones de tu imagen

Usa el nodo EmptySD3LatentImage para definir el tamaño de salida para OmniGen2:
- Ajusta ancho y alto según tus necesidades de OmniGen2
- Mantén batch_size en 1 para generación de imagen única

Elabora tu indicación de texto

En los nodos CLIP Text Encode (Prompt) para OmniGen2:
- Escribe indicaciones detalladas y descriptivas en el primer codificador
- Deja el segundo codificador vacío o añade indicaciones negativas
- OmniGen2 sobresale con descripciones composicionales complejas

Genera y guarda

Presiona Run para crear tu imagen de OmniGen2
VAE Decode convierte latentes en imagen final
Save Image guarda automáticamente tu creación de OmniGen2 en la carpeta de salida

Flujo de Trabajo de Edición de Imagen de OmniGen2#

Carga tu imagen fuente

Usa el nodo Load Image para importar la imagen que deseas editar con OmniGen2

Escribe tu instrucción de edición

En el nodo CLIP Text Encode (Prompt) para OmniGen2:
- Describe claramente y específicamente qué cambios deseas
- Ejemplos: "Transforma el color del cabello del personaje a blanco plateado natural", "Añadir gafas de aviador"
- Los comandos de lenguaje natural funcionan perfectamente con OmniGen2

Configura los parámetros de edición de OmniGen2

Nodo Scale Image to Total Pixels:
- upscale_method: area (mantiene calidad durante el redimensionamiento)
- megapixels: 2.00 (controla el conteo total de píxeles)
  - Esto redimensiona tu imagen a aproximadamente 2 millones de píxeles en total
  - Por ejemplo: escalaría una imagen de 1920x1080 para mantener ~2MP
  - Valores más altos = más detalle pero procesamiento más lento
  - Valores más bajos = generación más rápida pero menos detalle
  - 2.00 es óptimo para capacidades de edición <img src="https://cdn.runcomfy.net/workflow_assets/1247/readme01.webp" alt="OmniGen2" width="650"/>
VAE Encode convierte tu imagen escalada al espacio latente

Opcional: Habilitar entrada de segunda imagen

Los nodos púrpuras (omitidos) permiten operaciones de múltiples imágenes:
- Presiona Ctrl+B para alternar el modo de omisión
- Sube una segunda imagen para transferencia de estilo o inserción de objetos
- Perfecto para tareas como "combinar elementos de la imagen 1 y la imagen 2" <img src="https://cdn.runcomfy.net/workflow_assets/1247/readme02.webp" alt="OmniGen2" width="650"/>

Generar resultado editado

Ejecuta el flujo de trabajo de OmniGen2 para ver tus ediciones aplicadas
Los resultados mantienen alta fidelidad mientras siguen instrucciones con precisión

Reconocimientos#

Este flujo de trabajo ComfyUI integra el innovador modelo OmniGen2 desarrollado por investigadores en la Academia de Inteligencia Artificial de Beijing. Un reconocimiento especial va para el equipo por crear este sistema de generación multimodal unificada que empuja los límites de lo que es posible con un modelo de 7B parámetros. La arquitectura representa un avance significativo en equilibrar la eficiencia del modelo con la calidad de generación.

Más Recursos Sobre OmniGen2#

OmniGen2 se lanza bajo una licencia de código abierto, haciéndolo disponible gratuitamente para aplicaciones de investigación y comerciales. Para más información sobre OmniGen2:

GitHub Repository - Implementación oficial y detalles de la arquitectura del modelo: VectorSpaceLab/OmniGen2
Project Page - Descripción general completa con demostraciones e información técnica: Official Page
ComfyUI Examples - Tutoriales paso a paso y flujos de trabajo adicionales: ComfyUI Examples

Want More ComfyUI Workflows?

FLUX Kontext Dev | Edición Inteligente de Imágenes

Kontext Dev = Controlable + Todas las Necesidades de Diseño Gráfico en Una Herramienta

DreamO | Marco Unificado de Personalización de Imágenes Multi-Tarea

Realiza generación de imágenes de identidad, estilo, prueba y multi-condición a partir de 1 a 3 referencias

BAGEL AI | T2I + I2T + I2I

Comprensión y generación multimodal con IA de código abierto.

Step1X-Edit | Herramienta de Edición de Imágenes AI

Realiza 11 operaciones de edición con lenguaje natural en Step1X-Edit.

Cosmos-Predict2 | Text2Image & Video2World

¡Rápido y real! NVIDIA Cosmos con física verdadera.

LTX 2.3 VBVR | Generador de Video Consciente del Contexto

Añade lógica y flujo a cada secuencia de video generada.

Blender a ComfyUI AI Renderer 2.0 | Creador de Videos de Movimiento

Convierte renders de Blender en animaciones ricas y cinematográficas impulsadas por IA rápidamente.

MMAudio | Video a Audio

MMAudio: Modelo avanzado de video a audio para la generación de audio de alta calidad.

Soporte

Recursos

Legal

RunComfy

RunComfy es la principal ComfyUI plataforma, ofreciendo ComfyUI en línea entorno y servicios, junto con flujos de trabajo de ComfyUI con impresionantes imágenes. RunComfy también ofrece AI Models, permitiendo a los artistas aprovechar las últimas herramientas de AI para crear arte increíble.

OmniGen2 | Texto a Imagen & Edición