Flujo de Trabajo de LTX 2.3 Movie Builder: creación de películas coherentes, multiescena y conscientes del audio en ComfyUI#
El flujo de trabajo de LTX 2.3 Movie Builder es un sistema de creación de películas con IA que combina la inteligencia de indicaciones de Qwen/Gemma con el modelo de video LTX‑2.3 para producir películas coherentes multiescena, clips impulsados por la historia y videos musicales. Automatiza la planificación de escenas, la secuenciación de indicaciones y el ensamblaje de tomas mientras preserva la identidad de los personajes, la continuidad del movimiento y el ritmo cinematográfico. Puedes obtener resultados solo con texto, inicios de imagen a video o referencia de audio para sincronización de labios y tiempo de gestos, manteniendo el control creativo sobre el estilo, el movimiento de la cámara, la duración y el orden de edición.
Desarrollado por Mickmumpitz.ai para flujos de trabajo de producción, este gráfico de ComfyUI integra la creación de imágenes iniciales con FLUX.2, indicaciones estructuradas de discurso, acondicionamiento consciente del audio, escalado latente opcional y un ensamblador de tomas final. Si necesitas una línea de producción lista para rodar, el flujo de trabajo de LTX 2.3 Movie Builder te lleva de referencias y líneas de guion a un corte final con una configuración manual mínima.
Modelos clave en el flujo de trabajo de Comfyui LTX 2.3 Movie Builder#
- Lightricks LTX‑2.3 22B (solo transformador, FP8): el principal respaldo de texto a video utilizado para la generación de imagen a video y texto a video. Model
- LTX‑2.3 Distilled LoRA 384 1.1: pesos destilados que aceleran y estabilizan el muestreo de LTX‑2.3. LoRA
- LTX‑2.3 Spatial Upscaler x2 1.1: escalador latente opcional para videos más limpios y grandes. Model
- LTX‑2.3 Video VAE (BF16) y Audio VAE (BF16): VAEs para latentes de video y audio LTX. Video VAE · Audio VAE
- LTX‑2.3 ID LoRA TalkVid 3k: LoRA consciente de identidad que mejora la identidad al hablar y el movimiento de la boca. LoRA
- Gemma 3 12B IT + LTX‑2.3 Text Projection: pila de codificación de texto utilizada para indicaciones LTX. Encoder · Projection
- FLUX.2‑klein‑9B FP8: generador de imágenes rápido para marcos iniciales, accesorios y desarrollo de apariencia. Model
- FLUX.2‑klein‑9B Consistency LoRA V2 y 360 ERP Outpaint LoRA: mejoran la estabilidad temporal y el contexto amplio en activos. Consistency · 360 ERP
- Flux2 VAE y Qwen 3 8B codificador de texto para FLUX: codificadores utilizados en la ruta de creación de activos. Flux2 VAE · Qwen 3 8B
- Ruta opcional de bajo VRAM: LTX‑2.3 GGUF UNet cuantizado. GGUF
Cómo usar el flujo de trabajo de Comfyui LTX 2.3 Movie Builder#
En resumen: elige la resolución y fps de tu película, carga imágenes de protagonistas (cara/cuerpo), añade referencia de voz opcional, genera un marco inicial con FLUX o proporciona tu propio fotograma fijo, escribe una indicación estructurada y luego renderiza la toma. Duplica la toma para nuevas escenas y reordénalas en el ensamblador para exportar la película final.
AJUSTES#
Configura tu lienzo de video y ritmo en el LtxResolutionPicker (#13492) y Frame Rate (#13480). Los controles de muestreo global viven en Set_steps (#845) y Set_cfg (#851) y afectan tanto a la creación de activos como a la generación de video LTX. Si solo estás iterando en fotogramas fijos, activa/desactiva la ENABLE / DISABLE VIDEO GENERATION (#13715) para ahorrar tiempo. Estos ajustes definen cuánto dura cada clip y cómo se compone en la línea de tiempo final.
CARGAR MODELOS LTX#
La pila LTX se carga con UNETLoader (#13450), dos nodos Load Distilled LoRA (#10370, #10159) y el ID LoRA LoraLoaderModelOnly (#10324) para consistencia de personajes. Las indicaciones se codifican mediante DualCLIPLoader (#13451) usando Gemma + proyección LTX. Los VAEs de video y audio se cargan a través de VAELoader (#13449) y VAELoader (#13832), y el escalador latente opcional se proporciona mediante LatentUpscaleModelLoader (#10349). El gráfico almacena estos como valores "Get/Set" reutilizables para que cada toma lea el mismo paquete de modelos.
CARGAR MODELOS FLUX#
Para la creación de imágenes iniciales y desarrollo de apariencia, la ruta FLUX carga UNETLoader (#1992) con las LoRAs de Consistencia y 360 ERP (LoraLoaderModelOnly #6228, #13261). El texto se codifica con CLIPLoader (#362) usando Qwen, y las imágenes se decodifican con VAELoader (#360). Esta etapa es independiente, por lo que puedes iterar rápidamente en accesorios, entornos o tomas de establecimiento antes de entregarlos a LTX.
CARGAR IMÁGENES DEL PROTAGONISTA#
Añade tus referencias de cara y cuerpo con LoadImage (#4867, #1284) y el conjunto de compañeros (#13472, #13473) si es necesario. La cadena de herramientas "REMOVE BG" incorporada recorta automáticamente las caras y elimina los fondos para producir conjuntos FACE, BODY y FACEBODY (Set_FACE #3093, Set_BODY #3291, Set_FACEBODY #1334). Las referencias limpias son críticas para la retención de identidad a lo largo de las tomas.
CREADOR DE ACTIVOS (opcional)#
Si deseas que el flujo de trabajo cree un comienzo fijo preciso, escribe una descripción en Text Prompt (#13442) y ejecuta el muestreador FLUX KSampler (#13361). El marco resultante se almacena en caché como OUT_01 y se guarda a través de SaveImage (#13439), luego opcionalmente se armoniza con tus referencias usando ColorMatch (#13478). Esto se convierte en el ancla visual para el paso subsiguiente de imagen a video.
REFERENCIA DE AUDIO (opcional)#
Carga una referencia de voz o actuación con LoadAudio (#10343) y recórtala en TrimAudioDuration (#10344); previsualiza con PreviewAudio (#10346). El audio se pasa a LTXVReferenceAudio (#13329) cuando Enable Voice Reference (#13320) está activado, guiando las formas de la boca, la fraseología y los ritmos de gestos. Una segunda ranura de referencia (AUDIO REFERENCE 02) está disponible si deseas comparar o cambiar tomas a mitad de iteración.
TOMA 01#
Cada toma lee modelos y ajustes del grupo compartido, luego mezcla tus activos, indicaciones y audio opcional en un video. Introduce una descripción cinematográfica o una indicación impulsada por el discurso en Text Prompt (#13384); utiliza el formato incluido [VISUAL] / [SPEECH] / [SOUNDS] para obtener los mejores resultados. El comienzo fijo se preprocesa en LTXVPreprocess (#13308) y se anima en LTXVImgToVideoInplace (#13289), con acondicionamiento de audio proporcionado por LTXVReferenceAudio (#13329) cuando está habilitado. La tubería ejecuta un muestreador de dos etapas (SamplerCustomAdvanced #13316, #13331) y, si Enable Upscale (#13322) está activado, refina el detalle con LTXVLatentUpsampler (#13306). CreateVideo (#13310) combina los fotogramas y el audio; puedes guardar las salidas por toma a través de ShotVideoOutput (#13379) y Video Output (#13393).
SALIDA FINAL DE LA PELÍCULA#
Organiza el orden de las tomas con los nodos auxiliares MickmumpitzShotOrder (#8230) y MickmumpitzShotDuplicator (#6357), luego ensambla tu corte en Video Output - Shot Assembler (#5598). El ensamblador recorta y concatena clips, preparando una sola línea de tiempo para exportar. Renderiza la película final con Video Output (#5521). Para construir películas más largas, duplica TOMA 01, ajusta las indicaciones y las posiciones de entrada/salida, y vuelve a exportar.
Nodos clave en el flujo de trabajo de Comfyui LTX 2.3 Movie Builder#
LTXVImgToVideoInplace (#13289)#
Convierte un fotograma fijo de alta calidad en un latente de video temporalmente consistente mientras preserva la identidad y la composición. Úsalo para convertir inicios hechos con FLUX o tus propias referencias en movimiento. Combínalo con una dirección clara de escena en Text Prompt y mantén la misma semilla en todas las tomas cuando desees alternativos comparables.
LTXVReferenceAudio (#13329)#
Inyecta sincronización y pistas de fonemas de una base de voz o música para que el discurso y los gestos se alineen de forma natural. Funciona mejor con indicaciones que separan [VISUAL], [SPEECH] y [SOUNDS]. Activa Enable Voice Reference para alternar entre movimiento guiado por audio y puramente impulsado por indicaciones.
LTXVLatentUpsampler (#13306)#
Refina los detalles en el espacio latente utilizando el LTX‑2.3 Spatial Upscaler para texturas y bordes más nítidos. Habilítalo cuando las tomas se vayan a intercalar con primeros planos o superposiciones de texto; desactívalo para iterar más rápido durante el desarrollo de apariencia.
ColorMatch (#13478)#
Iguala el color entre tu comienzo fijo y una salida de referencia para mantener la continuidad a lo largo de las escenas. Útil al componer múltiples activos generados por FLUX o mezclar configuraciones de iluminación.
KSampler (#13361)#
El generador de activos FLUX que crea accesorios, ubicaciones y fotogramas heroicos para la etapa de video. Bloquea semillas para mantener un lenguaje visual consistente a lo largo de las secuencias, luego ajusta el texto para explorar pequeños cambios de estilo sin romper la continuidad.
Video Output - Shot Assembler (#5598)#
Recoge renders de tomas individuales y genera un solo corte. Úsalo para reordenar escenas, recortar de manera consistente y exportar la película en un solo paso.
Extras opcionales#
- Usa la estructura de indicaciones mostrada en el consejo del gráfico: descripción de escena [VISUAL], palabras exactas [SPEECH], estilo vocal y ambiente [SOUNDS]. Esto ayuda a los codificadores de texto y audio LTX a cooperar.
- Mantén la identidad del personaje estable proporcionando referencias tanto de cara como de cuerpo y activando el LTX‑2.3 ID LoRA.
- Para iteración rápida, desactiva el escalador y la referencia de voz, acorta la duración de la toma y usa el bypass de video para generar solo los fotogramas iniciales.
- En sistemas con menor VRAM, prueba la construcción GGUF de LTX‑2.3 y evita apilar LoRAs adicionales hasta los pases finales. GGUF
- Duplica TOMA 01 para nuevas escenas, varía las indicaciones mínimamente a lo largo de las tomas y reutiliza semillas para mantener el tono y la iluminación estables de corte a corte en todo tu flujo de trabajo de LTX 2.3 Movie Builder.
Reconocimientos#
Este flujo de trabajo implementa y se basa en los siguientes trabajos y recursos. Agradecemos sinceramente a Mickmumpitz por LTX 2.3 Movie Builder Workflow Source por sus contribuciones y mantenimiento. Para obtener detalles autorizados, consulta la documentación original y los repositorios enlazados a continuación.
Recursos#
- Mickmumpitz/LTX 2.3 Movie Builder Workflow Source
- Docs / Notas de lanzamiento: mickmumpitz.ai/posts/new-video-free-i-157336696
Nota: El uso de los modelos, conjuntos de datos y código referenciados está sujeto a las respectivas licencias y términos proporcionados por sus autores y mantenedores.


