LTX 2.3 MSR Flujo de trabajo en ComfyUI | Video de Identidad de Múltiples Sujetos

ComfyUI LTX 2.3 MSR Flujo de trabajo

LTX 2.3 MSR Workflow in ComfyUI | Multi-Subject Identity Video

¿Quiere ejecutar este flujo de trabajo?

Flujos de trabajo completamente operativos
Sin nodos ni modelos faltantes
No se requiere configuración manual
Presenta visuales impresionantes

ComfyUI LTX 2.3 MSR Ejemplos

LTX 2.3 MSR flujo de trabajo de video de identidad de múltiples sujetos para ComfyUI#

Este flujo de trabajo convierte varias referencias de personajes u objetos en un solo video consistente y listo para contar historias usando LTX 2.3 MSR. Preserva la identidad a través de múltiples sujetos mientras aprovecha el modelo audiovisual LTX‑2.3 para movimiento, cinematografía y sonido sincronizado. Los creadores pueden combinar hasta cuatro imágenes de sujetos más un fondo, luego guiar la escena con indicaciones para diálogos, tomas grupales y secuencias de estilo de vida dinámicas.

Construido para narradores, anunciantes y creadores sociales, el gráfico ensambla referencias en una guía MSR, inyecta identidad a través de un paso LoRA condicionado por imagen, y muestrea un latente audiovisual que se decodifica en fotogramas y audio opcional. LTX 2.3 MSR es el ancla para la fidelidad de identidad; el resto de la canalización maneja composición, guía de movimiento y exportación.

Modelos clave en el flujo de trabajo Comfyui LTX 2.3 MSR#

LTX‑2.3 22B destilado (1.1) por Lightricks. El modelo base audiovisual que genera movimiento, visuales y audio sincronizado. Los pesos están publicados en Hugging Face bajo LTX‑2.3. Lightricks/LTX-2.3
Gemma 3 12B Codificador de texto Instruct (fp4 mezclado). Usado para la codificación de indicaciones en la pila LTX para traducir texto en señales de acondicionamiento para la generación. Empaquetado con los activos LTX para ComfyUI. Comfy-Org/ltx-2
LTX 2.3 MSR LoRA (Licon MSR V1). Un LoRA de Referencia de Múltiples Sujetos especializado para LTX‑2.3 que bloquea múltiples identidades a la vez, estabilizando rostros, vestimenta y características de objetos en todo el clip. liconstudio/ComfyUI-Licon-MSR
LTX‑2 Audio VAE. Proporciona el espacio de audio latente y la decodificación utilizada al generar o adjuntar sonido sincronizado con los activos LTX‑2.x. Comfy-Org/ltx-2

Cómo usar el flujo de trabajo Comfyui LTX 2.3 MSR#

Este gráfico tiene tres fases: construir una guía MSR a partir de referencias, acondicionar el latente de video con orientación de múltiples imágenes e indicaciones, luego muestrear y decodificar en fotogramas y audio.

Comfig
- Establece tu lienzo width, height, total de frames, y fps en los nodos de configuración. Estos alimentan los latentes vacíos de video y audio y la etapa de exportación, manteniendo la sincronización consistente desde el acondicionamiento hasta el renderizado final.
- Elige el aspecto y la duración que se ajusten a tu historia. Un conteo de fotogramas más alto aumenta la continuidad del movimiento, pero también el uso de VRAM y el tiempo de ejecución.
Cargadores de referencias
- Carga hasta cuatro imágenes de sujetos (img1, img2, img3, img4) y un fondo (bg). Estos se mapean a los obtenedores refimg1..4 y refbg para que puedas cambiar rápidamente las fuentes sin volver a cablear.
- Usa imágenes claras y bien iluminadas con el sujeto centrado y sin obstrucciones. Para la vestimenta o accesorios que deseas preservar, asegúrate de que sean visibles en al menos una referencia.
Compositor MSR
- LiconMSR (#28) ensambla las referencias de sujetos y el fondo en una sola salida de imagen MSR. Esto se convierte en el plano de identidad visual para LTX 2.3 MSR, alineando rasgos faciales, atuendos y detalles de objetos antes del muestreo.
- Un pequeño VHS_VideoCombine (#66) crea una vista previa rápida de baja FPS a partir de la salida MSR para que puedas verificar la composición antes de ejecutar el renderizado completo.
Acondicionamiento de múltiples guías
- LTXVAddGuideMulti (#108) ingiere hasta cinco imágenes (tus cuatro sujetos más el fondo) junto con las indicaciones positivas y negativas para producir un latente de video inicial con orientación espacial y de apariencia.
- El texto de indicación positiva describe la escena, la cámara y el ambiente; el texto negativo evita artefactos y apariencias fuera de estilo. LTXVConditioning (#7) adjunta tu fps para que el tiempo de movimiento coincida con el exportador.
Control de identidad LoRA
- El LTX 2.3 MSR LoRA se carga en el modelo, y LTXAddVideoICLoRAGuide (#9) aplica un paso LoRA condicionado por imagen usando la imagen MSR. Esto refuerza la identidad a través de los fotogramas sin congelar el movimiento.
- Usa esta etapa para equilibrar la fuerza de la identidad con la libertad para el movimiento natural y las expresiones.
Muestreo
- La pila de muestreo utiliza CFGGuider (#37), KSamplerSelect (#13), ManualSigmas (#27), y RandomNoise (#15) alimentando SamplerCustomAdvanced (#16). El resultado es un latente audiovisual conjunto que refleja tus referencias, indicaciones y restricciones MSR.
- Si necesitas nuevas variaciones, cambia la semilla de ruido o el muestreador mientras mantienes las referencias y configuraciones MSR fijas para la consistencia.
Guía de recorte y decodificación
- LTXVCropGuides (#17) ajusta el latente de video a tu tamaño de fotograma objetivo, evitando recortes no deseados. Los latentes de video y audio se dividen luego por LTXVSeparateAVLatent (#24).
- VAEDecode (#38) convierte los latentes de video en fotogramas; LTXVAudioVAEDecode (#25) reconstruye el audio.
Exportación
- VHS_VideoCombine (#96) ensambla fotogramas y audio opcional en H.264 MP4 a tu fps elegido, usando tu filename_prefix. Este es el video final producido por el flujo de trabajo LTX 2.3 MSR.

Nodos clave en el flujo de trabajo Comfyui LTX 2.3 MSR#

`LiconMSR` (#28)#

Ensambla 1–4 referencias de sujetos más un fondo en una sola guía MSR. Establece width y height para que coincidan con tu lienzo objetivo para que la guía compuesta y los fotogramas finales se alineen. Si ves desviación de identidad, revisa las referencias de entrada o aumenta la prominencia de los sujetos clave en sus imágenes de origen.

`LTXVAddGuideMulti` (#108)#

Combina múltiples imágenes de guía con tus indicaciones para formar el latente de video inicial. Úsalo para priorizar qué referencias dominan la escena favoreciendo ligeramente a los sujetos principales. Mantén la guía de fondo activa para entornos estables y menos saltos de escena.

`LTXAddVideoICLoRAGuide` (#9)#

Inyecta el MSR LoRA condicionado por imagen usando la imagen MSR compuesta. Aumenta strength para reforzar la preservación de identidad para rostros, atuendos o accesorios; redúcelo si el movimiento se siente demasiado restringido. Las elecciones de recorte deben reflejar dónde aparecen los sujetos con más frecuencia en el fotograma.

`CFGGuider` (#37)#

Controla cuán fuertemente el muestreador sigue tus indicaciones. Un cfg más alto mejora la adherencia a la intención textual, pero puede reducir la variedad; valores moderados mantienen un aspecto natural mientras honran la guía MSR.

`SamplerCustomAdvanced` (#16)#

Ejecuta el proceso de eliminación de ruido usando tu muestreador elegido, sigmas y semilla de ruido. Los muestreadores estilo Euler o DPM funcionan bien con LTX‑2.3; explora semillas para alternar mientras mantienes las mismas referencias para retener la identidad.

`VHS_VideoCombine` (#96)#

Construye el MP4 final con audio opcional. Haz coincidir frame_rate con la etapa de acondicionamiento y establece un filename_prefix claro para la versionización. Usa la vista previa de este nodo para revisar el ritmo y la consistencia de identidad antes de compartir.

Extras opcionales#

Prepara referencias con ángulos neutrales y frontales y mínima oclusión; agrega un segundo ángulo para peinados complejos o accesorios.
Mantén las referencias de vestuario y accesorios lo suficientemente grandes para que las texturas y logotipos sean visibles; evita el desenfoque de movimiento pesado en las imágenes de origen.
Cuando la identidad es perfecta pero el movimiento es rígido, baja ligeramente la fuerza de la guía LoRA en la etapa LTX 2.3 MSR y agrega indicaciones para el movimiento.
Para historias más largas, aumenta frames y mantén fps constante para preservar el tiempo; para ediciones más rápidas, aumenta fps y acorta frames.
Usa una referencia de fondo similar en iluminación y perspectiva a tu escena prevista para menos inconsistencias.

Agradecimientos#

Este flujo de trabajo implementa y se basa en los siguientes trabajos y recursos. Agradecemos al proyecto LTX por el flujo de trabajo LTX 2.3 MSR (Referencia de Múltiples Sujetos) por sus contribuciones y mantenimiento. Para detalles autorizados, por favor consulta la documentación original y los repositorios enlazados a continuación.

Recursos#

Fuente del flujo de trabajo LTX/LTX 2.3 MSR
- Documentación / Notas de lanzamiento: Publicación de RunningHub

Nota: El uso de los modelos, conjuntos de datos y código referenciados está sujeto a las licencias y términos respectivos proporcionados por sus autores y mantenedores.

Want More ComfyUI Workflows?

HunyuanCustom | Generador de Video Multi-Subject

Crea videos de dos sujetos con una preservación de identidad excepcional.

HiDream-I1 | T2I

Generación de imágenes de alta calidad utilizando un modelo de 17 mil millones de parámetros.

ComfyUI Phantom | Sujeto a Video

Generación de video basada en referencias usando Wan2.1 14B

Edición de Video Bernini Pro | Generador Multimodal

Convierte tus videos en obras maestras inteligentes y conscientes de la identidad.

SteadyDancer | Generador Realista de Imágenes a Video

Convierte retratos en videos de movimiento suave y realista al instante.

MatAnyone Video Matting | Eliminación de Máscara Única

Elimina fondos de video con un cuadro de máscara para un aislamiento perfecto del sujeto.

LTX 2.3 ID-LoRA | Generador de Avatares Parlantes

Crea avatares parlantes realistas con voz y visuales sincronizados.

InfiniteYou | Generación de Rostros con Preservación de Identidad

Generación con preservación de identidad en modo dual con los flujos de trabajo Face Combine y Zero-Shot usando InfiniteYou.

Soporte

Recursos

Legal

RunComfy

RunComfy es la principal ComfyUI plataforma, ofreciendo ComfyUI en línea entorno y servicios, junto con flujos de trabajo de ComfyUI con impresionantes imágenes. RunComfy también ofrece AI Models, permitiendo a los artistas aprovechar las últimas herramientas de AI para crear arte increíble.

LTX 2.3 MSR | Generador de Video de Múltiples Sujetos