OmniGen2 | Texto a Imagen & Edición
Experimenta el poder de la generación multimodal unificada de OmniGen2 en ComfyUI. Este flujo de trabajo utiliza un modelo de 7B parámetros con arquitectura de Transformer de doble vía para ofrecer una generación excepcional de texto a imagen y edición de imagen guiada por texto. Construido sobre la base Qwen 2.5 VL, OmniGen2 destaca en comprensión composicional, seguimiento de instrucciones largas y modificaciones precisas de imágenes mientras mantiene calidad visual y consistencia.ComfyUI OmniGen2 Flujo de trabajo

- Flujos de trabajo completamente operativos
- Sin nodos ni modelos faltantes
- No se requiere configuración manual
- Presenta visuales impresionantes
ComfyUI OmniGen2 Ejemplos




ComfyUI OmniGen2 Descripción
¿Qué es el Flujo de Trabajo OmniGen2 ComfyUI?
El flujo de trabajo OmniGen2 ComfyUI lleva la generación multimodal unificada a tus manos, combinando síntesis de texto a imagen y edición de imagen basada en instrucciones en un marco único y poderoso. Piensa en ello como tener un asistente de IA creativo que no solo genera imágenes impresionantes a partir de tus descripciones de texto, sino que también entiende y ejecuta comandos de edición complejos con una precisión notable.
Este flujo de trabajo aprovecha un sofisticado modelo de 7B parámetros construido sobre la base Qwen 2.5 VL, con una arquitectura única de Transformer de doble vía. Lo que hace especial a este modelo es su diseño desacoplado - utilizando caminos separados para generación de texto e imagen, permitiéndole mantener una comprensión excepcional del lenguaje mientras ofrece salidas visuales de alta fidelidad que son fieles a tu visión creativa.
Características y Beneficios Clave de OmniGen2
Modos de Generación Dual: OmniGen2 crea nuevas imágenes a partir de texto o edita las existentes con comandos de lenguaje natural a través de la interfaz intuitiva.
Arquitectura Avanzada: El diseño de doble vía de OmniGen2 separa el procesamiento de texto e imagen para un rendimiento óptimo.
Comprensión Composicional: OmniGen2 maneja indicaciones complejas de múltiples elementos con una precisión excepcional en cada generación.
Edición Precisa de Imágenes: Realiza cambios específicos mientras preserva el resto de tu imagen perfectamente usando algoritmos avanzados de OmniGen2.
Reflexión Multimodal: OmniGen2 se autoanaliza y refina salidas para mejorar los resultados.
Cómo Usar OmniGen2 en ComfyUI
Flujo de Trabajo de Texto a Imagen de OmniGen2
Configura las dimensiones de tu imagen
- Usa el nodo EmptySD3LatentImage para definir el tamaño de salida para OmniGen2:
- Ajusta ancho y alto según tus necesidades de OmniGen2
- Mantén batch_size en 1 para generación de imagen única
Elabora tu indicación de texto
- En los nodos CLIP Text Encode (Prompt) para OmniGen2:
- Escribe indicaciones detalladas y descriptivas en el primer codificador
- Deja el segundo codificador vacío o añade indicaciones negativas
- OmniGen2 sobresale con descripciones composicionales complejas
Genera y guarda
- Presiona
Run
para crear tu imagen de OmniGen2 - VAE Decode convierte latentes en imagen final
- Save Image guarda automáticamente tu creación de OmniGen2 en la carpeta de salida
Flujo de Trabajo de Edición de Imagen de OmniGen2
Carga tu imagen fuente
- Usa el nodo Load Image para importar la imagen que deseas editar con OmniGen2

Escribe tu instrucción de edición
- En el nodo CLIP Text Encode (Prompt) para OmniGen2:
- Describe claramente y específicamente qué cambios deseas
- Ejemplos: "Transforma el color del cabello del personaje a blanco plateado natural", "Añadir gafas de aviador"
- Los comandos de lenguaje natural funcionan perfectamente con OmniGen2
Configura los parámetros de edición de OmniGen2
- Nodo Scale Image to Total Pixels:
- upscale_method: area (mantiene calidad durante el redimensionamiento)
- megapixels: 2.00 (controla el conteo total de píxeles)
- Esto redimensiona tu imagen a aproximadamente 2 millones de píxeles en total
- Por ejemplo: escalaría una imagen de 1920x1080 para mantener ~2MP
- Valores más altos = más detalle pero procesamiento más lento
- Valores más bajos = generación más rápida pero menos detalle
- 2.00 es óptimo para capacidades de edición
- VAE Encode convierte tu imagen escalada al espacio latente
Opcional: Habilitar entrada de segunda imagen
- Los nodos púrpuras (omitidos) permiten operaciones de múltiples imágenes:
- Presiona Ctrl+B para alternar el modo de omisión
- Sube una segunda imagen para transferencia de estilo o inserción de objetos
- Perfecto para tareas como "combinar elementos de la imagen 1 y la imagen 2"
Generar resultado editado
- Ejecuta el flujo de trabajo de OmniGen2 para ver tus ediciones aplicadas
- Los resultados mantienen alta fidelidad mientras siguen instrucciones con precisión
Reconocimientos
Este flujo de trabajo ComfyUI integra el innovador modelo OmniGen2 desarrollado por investigadores en la Academia de Inteligencia Artificial de Beijing. Un reconocimiento especial va para el equipo por crear este sistema de generación multimodal unificada que empuja los límites de lo que es posible con un modelo de 7B parámetros. La arquitectura representa un avance significativo en equilibrar la eficiencia del modelo con la calidad de generación.
Más Recursos Sobre OmniGen2
OmniGen2 se lanza bajo una licencia de código abierto, haciéndolo disponible gratuitamente para aplicaciones de investigación y comerciales. Para más información sobre OmniGen2:
- GitHub Repository - Implementación oficial y detalles de la arquitectura del modelo:
- Project Page - Descripción general completa con demostraciones e información técnica:
- ComfyUI Examples - Tutoriales paso a paso y flujos de trabajo adicionales:
¿Quiere más flujos de trabajo de ComfyUI?
RunComfy es la principal ComfyUI plataforma, ofreciendo ComfyUI en línea entorno y servicios, junto con flujos de trabajo de ComfyUI con impresionantes imágenes. RunComfy también ofrece AI Playground, permitiendo a los artistas aprovechar las últimas herramientas de AI para crear arte increíble.