Cosmos-Predict2 Text2Image Video2World

ComfyUI Cosmos-Predict2 Flujo de trabajo

¿Quiere ejecutar este flujo de trabajo?

Flujos de trabajo completamente operativos
Sin nodos ni modelos faltantes
No se requiere configuración manual
Presenta visuales impresionantes

ComfyUI Cosmos-Predict2 Ejemplos

cosmos-predict2-text2image-video2world-comfyui-workflow-1248-example_01.webp

¿Qué es el flujo de trabajo Cosmos-Predict2 ComfyUI?#

El flujo de trabajo Cosmos-Predict2 ComfyUI trae el modelo de base de mundo físico de próxima generación de NVIDIA a tus manos, permitiendo tanto la generación de texto a imagen de alta calidad como la innovadora transformación de video a mundo. Piénsalo como tener una bola de cristal digital que no solo puede crear imágenes impresionantes a partir de descripciones de texto, sino también predecir y generar secuencias de video realistas que siguen las leyes de la física.

Este flujo de trabajo Cosmos-Predict2 aprovecha un sofisticado modelo de base de 2 mil millones de parámetros diseñado específicamente para escenarios de IA física. ¿Qué hace especial a Cosmos-Predict2? No solo genera imágenes bonitas, entiende la física, las interacciones ambientales y las dinámicas realistas, lo que hace a Cosmos-Predict2 perfecto para simulación industrial, escenarios de conducción autónoma, planificación urbana y aplicaciones de investigación científica.

Características clave y beneficios de Cosmos-Predict2#

Modos de generación duales: Cosmos-Predict2 admite tanto la generación de texto a imagen para crear visuales estáticos como la transformación de video a mundo para la predicción de escenas dinámicas, todo dentro de un solo flujo de trabajo Cosmos-Predict2 ComfyUI.

Precisión física: A diferencia de los generadores de imágenes estándar, Cosmos-Predict2 mantiene una precisión física excepcional e interactividad ambiental, asegurando que el contenido generado por Cosmos-Predict2 siga la física y dinámica del mundo real.

Aplicaciones profesionales: Cosmos-Predict2 está diseñado para casos de uso serios, incluyendo simulación industrial, desarrollo de conducción autónoma, visualización de planificación urbana e investigación científica donde la precisión es lo más importante.

Control de video flexible: El componente de generación de video Cosmos-Predict2 incluye control opcional del primer y último fotograma, permitiendo una dirección precisa sobre secuencias temporales y transiciones de escena dentro del flujo de trabajo Cosmos-Predict2.

Cómo usar Cosmos-Predict2 en ComfyUI#

Flujo de trabajo de texto a imagen Cosmos-Predict2#

Establece las dimensiones de tu imagen

Usa el nodo EmptySD3LatentImage para definir el tamaño de salida de tu generación Cosmos-Predict2:
- Por defecto: 1024x1024 píxeles
- Ajusta el ancho y la altura según tus requisitos de Cosmos-Predict2
- Mantén batch_size en 1 para generación de imagen única

Elabora tu indicación de texto

En el nodo CLIP Text Encode (Prompt) para Cosmos-Predict2:
- Escribe indicaciones detalladas y descriptivas para obtener los mejores resultados de Cosmos-Predict2
- Cosmos-Predict2 sobresale con descripciones del mundo físico
- Incluye detalles ambientales y relaciones espaciales en tus indicaciones de Cosmos-Predict2 <img src="https://cdn.runcomfy.net/workflow_assets/1248/readme01.webp" alt="Cosmos-Predict2" width="750"/>
Genera y guarda
- Presiona Run para crear tu imagen Cosmos-Predict2, que se guarda automáticamente en el directorio de salida.

Flujo de trabajo de video a mundo Cosmos-Predict2#

Sube tu imagen de entrada
- Usa el nodo Load Image para importar tu fotograma inicial para la generación de video Cosmos-Predict2.
Configura los parámetros de video
- En el nodo CosmosPredict2ImageToVideoLatent:
  - Ancho/Altura: Establece en 848x480 para un rendimiento óptimo de Cosmos-Predict2
  - Longitud: 33 fotogramas para videos de Cosmos-Predict2 de ~2 segundos a 16fps
  - Batch_size: Mantén en 1 para el procesamiento de Cosmos-Predict2 <img src="https://cdn.runcomfy.net/workflow_assets/1248/readme02.webp" alt="Cosmos-Predict2" width="750"/>
Control de fotograma opcional
- activa los nodos omitidos (Ctrl+B) para el control del primer y último fotograma en Cosmos-Predict2:
  - Sube imágenes adicionales para guiar los puntos de inicio y fin de video de Cosmos-Predict2
  - Perfecto para crear secuencias narrativas específicas con Cosmos-Predict2
Ejecuta la generación de video
- Ejecuta el flujo de trabajo de Cosmos-Predict2 para crear secuencias de video conscientes de la física que mantienen la consistencia temporal.

Configuraciones esenciales para Cosmos-Predict2

Configuración de KSampler para Cosmos-Predict2:
- Pasos: 35 (predeterminado para el equilibrio de calidad de Cosmos-Predict2)
- CFG: 4.0 para una fuerza de guía adecuada de Cosmos-Predict2
- Sampler: euler (recomendado para Cosmos-Predict2)
- Scheduler: karras para una generación suave de Cosmos-Predict2
Configuraciones de generación de video de Cosmos-Predict2:
- FPS: 16 fotogramas por segundo (óptimo para Cosmos-Predict2)
- Formato: Detecta automáticamente el mejor códec para tu sistema Cosmos-Predict2
- Menor cantidad de fotogramas = generación más rápida de Cosmos-Predict2, mayor = movimiento más suave

Reconocimiento#

Este flujo de trabajo Cosmos-Predict2 ComfyUI integra el modelo de base Cosmos-Predict2 de NVIDIA, un avance en generación de IA de mundo físico. Reconocimiento especial al equipo de investigación de NVIDIA por desarrollar este modelo avanzado de simulación física Cosmos-Predict2 y a la comunidad de ComfyUI por permitir una integración perfecta de Cosmos-Predict2. Los pesos del modelo Cosmos-Predict2 y la implementación técnica siguen las especificaciones oficiales de Cosmos-Predict2 de NVIDIA, asegurando un rendimiento auténtico para aplicaciones profesionales.

Más recursos sobre Cosmos-Predict2#

Explora recursos técnicos y documentación relacionados con Cosmos-Predict2:

Repositorio GitHub – Implementación oficial de Cosmos-Predict2 y archivos de modelo. Cosmos-predict2
HuggingFace Hub – Pesos de modelo preentrenados de Cosmos-Predict2 y documentación para la integración de ComfyUI. Cosmos-Predict2

Want More ComfyUI Workflows?

Nvidia Cosmos | Creación de Texto e Imagen a Video

Genera videos a partir de indicaciones de texto o crea interpolación de fotogramas entre dos imágenes con Cosmos de Nvidia.

Inferencia Z-Image De-Turbo LoRA | AI Toolkit ComfyUI

Ejecute su Z-Image De-Turbo LoRA entrenado con AI Toolkit en ComfyUI con un comportamiento coincidente al entrenamiento utilizando un solo nodo personalizado RCZimageDeturbo.

Ponlo Aquí Kontext | Reemplazo de Objetos

Pon cualquier cosa en cualquier lugar. Kontext lo hace ver real. Funciona perfectamente.

LayerDiffuse + TripoSR | Imagen a 3D

Usa LayerDiffuse para la transparencia de imágenes y TripoSR para la creación rápida de objetos 3D

LongCat Avatar en ComfyUI | Animación de Avatar con Consistencia de Identidad

Convierte una imagen en una animación de avatar suave y consistente en identidad.

Mesh Graphormer ControlNet | Corregir manos

Mesh Graphormer ControlNet corrige las manos malformadas en las imágenes mientras preserva el resto.

Era3D | ComfyUI 3D Pack

Genera contenido 3D, desde imágenes multivista hasta mallas detalladas.

ControlNet Tile + 4x UltraSharp | Mejorador de Imágenes/Videos

Use ControlNet Tile, 4xUltraSharp y interpolación de cuadros para un resultado de alta resolución.

Soporte

Recursos

Legal

RunComfy

RunComfy es la principal ComfyUI plataforma, ofreciendo ComfyUI en línea entorno y servicios, junto con flujos de trabajo de ComfyUI con impresionantes imágenes. RunComfy también ofrece AI Models, permitiendo a los artistas aprovechar las últimas herramientas de AI para crear arte increíble.

Cosmos-Predict2 | Text2Image & Video2World