LTX 2.3 MSR flujo de trabajo de video de identidad de múltiples sujetos para ComfyUI#
Este flujo de trabajo convierte varias referencias de personajes u objetos en un solo video consistente y listo para contar historias usando LTX 2.3 MSR. Preserva la identidad a través de múltiples sujetos mientras aprovecha el modelo audiovisual LTX‑2.3 para movimiento, cinematografía y sonido sincronizado. Los creadores pueden combinar hasta cuatro imágenes de sujetos más un fondo, luego guiar la escena con indicaciones para diálogos, tomas grupales y secuencias de estilo de vida dinámicas.
Construido para narradores, anunciantes y creadores sociales, el gráfico ensambla referencias en una guía MSR, inyecta identidad a través de un paso LoRA condicionado por imagen, y muestrea un latente audiovisual que se decodifica en fotogramas y audio opcional. LTX 2.3 MSR es el ancla para la fidelidad de identidad; el resto de la canalización maneja composición, guía de movimiento y exportación.
Modelos clave en el flujo de trabajo Comfyui LTX 2.3 MSR#
- LTX‑2.3 22B destilado (1.1) por Lightricks. El modelo base audiovisual que genera movimiento, visuales y audio sincronizado. Los pesos están publicados en Hugging Face bajo LTX‑2.3. Lightricks/LTX-2.3
- Gemma 3 12B Codificador de texto Instruct (fp4 mezclado). Usado para la codificación de indicaciones en la pila LTX para traducir texto en señales de acondicionamiento para la generación. Empaquetado con los activos LTX para ComfyUI. Comfy-Org/ltx-2
- LTX 2.3 MSR LoRA (Licon MSR V1). Un LoRA de Referencia de Múltiples Sujetos especializado para LTX‑2.3 que bloquea múltiples identidades a la vez, estabilizando rostros, vestimenta y características de objetos en todo el clip. liconstudio/ComfyUI-Licon-MSR
- LTX‑2 Audio VAE. Proporciona el espacio de audio latente y la decodificación utilizada al generar o adjuntar sonido sincronizado con los activos LTX‑2.x. Comfy-Org/ltx-2
Cómo usar el flujo de trabajo Comfyui LTX 2.3 MSR#
Este gráfico tiene tres fases: construir una guía MSR a partir de referencias, acondicionar el latente de video con orientación de múltiples imágenes e indicaciones, luego muestrear y decodificar en fotogramas y audio.
- Comfig
- Establece tu lienzo
width,height, total deframes, yfpsen los nodos de configuración. Estos alimentan los latentes vacíos de video y audio y la etapa de exportación, manteniendo la sincronización consistente desde el acondicionamiento hasta el renderizado final. - Elige el aspecto y la duración que se ajusten a tu historia. Un conteo de fotogramas más alto aumenta la continuidad del movimiento, pero también el uso de VRAM y el tiempo de ejecución.
- Establece tu lienzo
- Cargadores de referencias
- Carga hasta cuatro imágenes de sujetos (
img1,img2,img3,img4) y un fondo (bg). Estos se mapean a los obtenedoresrefimg1..4yrefbgpara que puedas cambiar rápidamente las fuentes sin volver a cablear. - Usa imágenes claras y bien iluminadas con el sujeto centrado y sin obstrucciones. Para la vestimenta o accesorios que deseas preservar, asegúrate de que sean visibles en al menos una referencia.
- Carga hasta cuatro imágenes de sujetos (
- Compositor MSR
LiconMSR(#28) ensambla las referencias de sujetos y el fondo en una sola salida de imagen MSR. Esto se convierte en el plano de identidad visual para LTX 2.3 MSR, alineando rasgos faciales, atuendos y detalles de objetos antes del muestreo.- Un pequeño
VHS_VideoCombine(#66) crea una vista previa rápida de baja FPS a partir de la salida MSR para que puedas verificar la composición antes de ejecutar el renderizado completo.
- Acondicionamiento de múltiples guías
LTXVAddGuideMulti(#108) ingiere hasta cinco imágenes (tus cuatro sujetos más el fondo) junto con las indicaciones positivas y negativas para producir un latente de video inicial con orientación espacial y de apariencia.- El texto de indicación positiva describe la escena, la cámara y el ambiente; el texto negativo evita artefactos y apariencias fuera de estilo.
LTXVConditioning(#7) adjunta tufpspara que el tiempo de movimiento coincida con el exportador.
- Control de identidad LoRA
- El LTX 2.3 MSR LoRA se carga en el modelo, y
LTXAddVideoICLoRAGuide(#9) aplica un paso LoRA condicionado por imagen usando la imagen MSR. Esto refuerza la identidad a través de los fotogramas sin congelar el movimiento. - Usa esta etapa para equilibrar la fuerza de la identidad con la libertad para el movimiento natural y las expresiones.
- El LTX 2.3 MSR LoRA se carga en el modelo, y
- Muestreo
- La pila de muestreo utiliza
CFGGuider(#37),KSamplerSelect(#13),ManualSigmas(#27), yRandomNoise(#15) alimentandoSamplerCustomAdvanced(#16). El resultado es un latente audiovisual conjunto que refleja tus referencias, indicaciones y restricciones MSR. - Si necesitas nuevas variaciones, cambia la semilla de ruido o el muestreador mientras mantienes las referencias y configuraciones MSR fijas para la consistencia.
- La pila de muestreo utiliza
- Guía de recorte y decodificación
LTXVCropGuides(#17) ajusta el latente de video a tu tamaño de fotograma objetivo, evitando recortes no deseados. Los latentes de video y audio se dividen luego porLTXVSeparateAVLatent(#24).VAEDecode(#38) convierte los latentes de video en fotogramas;LTXVAudioVAEDecode(#25) reconstruye el audio.
- Exportación
VHS_VideoCombine(#96) ensambla fotogramas y audio opcional en H.264 MP4 a tufpselegido, usando tufilename_prefix. Este es el video final producido por el flujo de trabajo LTX 2.3 MSR.
Nodos clave en el flujo de trabajo Comfyui LTX 2.3 MSR#
LiconMSR (#28)#
Ensambla 1–4 referencias de sujetos más un fondo en una sola guía MSR. Establece width y height para que coincidan con tu lienzo objetivo para que la guía compuesta y los fotogramas finales se alineen. Si ves desviación de identidad, revisa las referencias de entrada o aumenta la prominencia de los sujetos clave en sus imágenes de origen.
LTXVAddGuideMulti (#108)#
Combina múltiples imágenes de guía con tus indicaciones para formar el latente de video inicial. Úsalo para priorizar qué referencias dominan la escena favoreciendo ligeramente a los sujetos principales. Mantén la guía de fondo activa para entornos estables y menos saltos de escena.
LTXAddVideoICLoRAGuide (#9)#
Inyecta el MSR LoRA condicionado por imagen usando la imagen MSR compuesta. Aumenta strength para reforzar la preservación de identidad para rostros, atuendos o accesorios; redúcelo si el movimiento se siente demasiado restringido. Las elecciones de recorte deben reflejar dónde aparecen los sujetos con más frecuencia en el fotograma.
CFGGuider (#37)#
Controla cuán fuertemente el muestreador sigue tus indicaciones. Un cfg más alto mejora la adherencia a la intención textual, pero puede reducir la variedad; valores moderados mantienen un aspecto natural mientras honran la guía MSR.
SamplerCustomAdvanced (#16)#
Ejecuta el proceso de eliminación de ruido usando tu muestreador elegido, sigmas y semilla de ruido. Los muestreadores estilo Euler o DPM funcionan bien con LTX‑2.3; explora semillas para alternar mientras mantienes las mismas referencias para retener la identidad.
VHS_VideoCombine (#96)#
Construye el MP4 final con audio opcional. Haz coincidir frame_rate con la etapa de acondicionamiento y establece un filename_prefix claro para la versionización. Usa la vista previa de este nodo para revisar el ritmo y la consistencia de identidad antes de compartir.
Extras opcionales#
- Prepara referencias con ángulos neutrales y frontales y mínima oclusión; agrega un segundo ángulo para peinados complejos o accesorios.
- Mantén las referencias de vestuario y accesorios lo suficientemente grandes para que las texturas y logotipos sean visibles; evita el desenfoque de movimiento pesado en las imágenes de origen.
- Cuando la identidad es perfecta pero el movimiento es rígido, baja ligeramente la fuerza de la guía LoRA en la etapa LTX 2.3 MSR y agrega indicaciones para el movimiento.
- Para historias más largas, aumenta
framesy manténfpsconstante para preservar el tiempo; para ediciones más rápidas, aumentafpsy acortaframes. - Usa una referencia de fondo similar en iluminación y perspectiva a tu escena prevista para menos inconsistencias.
Agradecimientos#
Este flujo de trabajo implementa y se basa en los siguientes trabajos y recursos. Agradecemos al proyecto LTX por el flujo de trabajo LTX 2.3 MSR (Referencia de Múltiples Sujetos) por sus contribuciones y mantenimiento. Para detalles autorizados, por favor consulta la documentación original y los repositorios enlazados a continuación.
Recursos#
- Fuente del flujo de trabajo LTX/LTX 2.3 MSR
- Documentación / Notas de lanzamiento: Publicación de RunningHub
Nota: El uso de los modelos, conjuntos de datos y código referenciados está sujeto a las licencias y términos respectivos proporcionados por sus autores y mantenedores.


