LTX 2.3 Outpainting para ComfyUI: Expansión de fotogramas de video sin interrupciones con consistencia temporal#
Este flujo de trabajo implementa LTX 2.3 Outpainting para extender los fotogramas de video más allá de sus límites originales mientras preserva el movimiento, la iluminación y la perspectiva. Está diseñado para editores y creadores que necesitan cambios de proporción de aspecto, extensiones laterales o verticales y reenmarcado cinematográfico sin romper la continuidad. Usando la guía IC‑LoRA, LTX 2.3 Outpainting llena regiones de lienzo enmascaradas de manera consistente a lo largo del tiempo y también puede generar audio sincronizado.
Construido alrededor del modelo LTX‑2.3 de Lightricks y su integración en ComfyUI, el gráfico acopla un preprocesador de outpaint inteligente con el condicionamiento IC‑LoRA para guiar la generación en las áreas recién añadidas. Puedes ejecutar variantes puras de texto-a-video o imagen-a-video, previsualizar los fotogramas de control y exportar un MP4 final con audio.
Modelos clave en el flujo de trabajo de LTX 2.3 Outpainting en Comfyui#
- LTX‑2.3 22B checkpoint. Modelo de difusión audio-video central que impulsa la calidad de generación y la estabilidad temporal. Usa los pesos oficiales de LTX‑2.3 como ltx‑2.3‑22b‑dev o ltx‑2.3‑22b‑distilled‑1.1 para ejecuciones más rápidas página de Hugging Face y los detalles del modelo ascendente en el repositorio LTX‑Video GitHub y el documento arXiv.
- Gemma 3 12B Instruct codificador de texto con proyección de texto LTX 2.3. Codifica instrucciones con fuerte adherencia, alimentando LTX‑2.3 a través de la configuración de doble codificador de ComfyUI. Consulta la tarjeta del codificador Hugging Face y el soporte de ComfyUI GitHub.
- LTX‑2.3 video VAE y audio VAE. Mapea entre el espacio de píxeles o forma de onda y el espacio latente del modelo para decodificar fotogramas finales y audio. Distribuido en el paquete ComfyUI‑LTXVideo GitHub.
- LTX 2.3 Outpainting IC‑LoRA. Una expansión espacial LoRA que condiciona LTX‑2.3 para tratar regiones enmascaradas o negras como áreas de generación, preservando la continuidad de la escena a lo largo del tiempo. Aprovecha el condicionamiento IC‑LoRA proporcionado por los nodos LTXVideo GitHub.
- Preprocesador de Video Outpaint. El nodo de outpaint estilo VACE calcula el nuevo lienzo, la máscara y los fotogramas de control utilizados por LTX 2.3 Outpainting para guiar la síntesis en las regiones ampliadas GitHub.
Cómo usar el flujo de trabajo de LTX 2.3 Outpainting en Comfyui#
El flujo de trabajo tiene cinco grupos coordinados. VACE OUTPAINT propone el nuevo lienzo y máscara, LTX 2.3 Preprocess prepara las entradas, SAMPLING sintetiza video y audio, y la etapa de salida codifica el MP4 final. PROMPTING y MODELS se ejecutan en paralelo para proporcionar condicionamiento de texto y pesos.
MODELS#
Este grupo carga el checkpoint base LTX‑2.3 y aplica LTX 2.3 Outpainting IC‑LoRA para que el modelo aprenda dónde agregar nuevo contenido. Los VAEs de video y audio se inicializan para decodificar fotogramas y formas de onda. El estado del modelo se pasa a los nodos de guía y muestreo para que los mismos pesos impulsen tanto el condicionamiento como la eliminación de ruido. No necesitas cambiar nada aquí a menos que desees cambiar el checkpoint base o un IC‑LoRA diferente.
PROMPTING#
Las instrucciones positivas y negativas son codificadas por una configuración de doble codificador, emparejando Gemma 3 12B con la proyección de texto LTX 2.3. Escribe lo que quieres ver en los márgenes añadidos junto con pistas de movimiento y dirección de iluminación para alinear el contenido outpainted. El estilo o contenido que no deseas va en la instrucción negativa. Los codificadores producen flujos de condicionamiento que luego se fusionan con la guía LTX 2.3 Outpainting.
VACE OUTPAINT#
Coloca un video fuente en el cargador para generar imágenes por fotograma. El nodo VACEOutpaint (#5109) calcula un lienzo expandido y una máscara precisa que marca el área de nueva generación. El gráfico compone los fotogramas originales en este lienzo más grande con ImageCompositeMasked (#5110), resultando en fotogramas de control que muestran claramente las regiones de “mantener” frente a “sintetizar”. Una rama de vista previa ensambla estos fotogramas de control en un MP4 liviano para que puedas confirmar la geometría outpaint antes de generar. El ancho, altura y longitud de la secuencia de esta etapa impulsan la configuración latente descendente, para que el modelo funcione al tamaño exacto expandido.
LTX 2.3 Preprocess#
Los fotogramas compuestos son normalizados para LTX‑2.3 con LTXVPreprocess (#3336). Si deseas anclaje de imagen-a-video, establece bypass_i2v en false para que LTXVImgToVideoConditionOnly (#3159) condicione el movimiento en los fotogramas de control; para outpainting puro de texto-a-video configúralo en true. LTXVConditioning (#1241) adjunta el condicionamiento de las instrucciones y hereda la tasa de fotogramas del cargador de video, manteniendo el audio y el video sincronizados. Estas señales fluyen hacia LTXAddVideoICLoRAGuide para informar dónde y cómo LTX 2.3 Outpainting debe llenar las áreas enmascaradas.
SAMPLING#
LTXAddVideoICLoRAGuide (#5012) fusiona las instrucciones, el condicionamiento opcional de imagen, la imagen de control outpainted y el IC‑LoRA en un solo paquete de guía. Un latente de audio vacío con el conteo de fotogramas correcto se concatena para que el audio se genere en sincronización con el video. El sampler usa CFGGuider (#4828) con un eliminador de ruido seleccionado por KSamplerSelect y un horario corto de ManualSigmas para equilibrar la adherencia a las instrucciones y la suavidad temporal. SamplerCustomAdvanced (#4829) produce un latente conjunto de audio-video que luego se divide para la decodificación.
Decodificación y exportación#
VAEDecodeTiled (#4851) decodifica fotogramas de video eficientemente a la resolución expandida, y LTXVAudioVAEDecode (#4848) reconstruye la forma de onda. VHS_VideoCombine (#5137) combina fotogramas y audio en un MP4 y lo escribe en tu carpeta de salida a la tasa de fotogramas heredada. Una rama de vista previa separada ensambla el video de control VACE para iteraciones rápidas antes de las ejecuciones finales.
Nodos clave en el flujo de trabajo de LTX 2.3 Outpainting en Comfyui#
VACEOutpaint (#5109)#
Calcula el lienzo objetivo y una máscara binaria o difuminada que marca las regiones de outpaint. Expande a la izquierda o derecha para reenmarcados panorámicos o arriba y abajo para conversiones verticales, luego confirma en el video de vista previa. Mantén el crecimiento moderado para el primer pase, itera si necesitas más espacio. Las regiones negras o claramente enmascaradas funcionan mejor porque LTX 2.3 Outpainting está entrenado para tratarlas como zonas de generación.
LTXAddVideoICLoRAGuide (#5012)#
Central para LTX 2.3 Outpainting, este nodo inyecta el IC‑LoRA y usa los fotogramas de control compuestos para sesgar la generación en áreas enmascaradas solamente. Aumenta la fuerza de LoRA para imponer un comportamiento de expansión espacial más fuerte, redúcelo si el modelo comienza a sobrescribir contenido original. El factor de reducción de escala latente proviene del cargador y debe dejarse como configurado a menos que estés equilibrando velocidad contra detalle.
CFGGuider (#4828)#
Controla cuán estrictamente el modelo sigue tus instrucciones frente al condicionamiento de entrada. Aumenta la guía para afinar la adherencia en los márgenes recién añadidos, bájala si el movimiento se vuelve inestable. Considera cambios menores junto con el horario de sigma en lugar de saltos grandes.
SamplerCustomAdvanced (#4829) con KSamplerSelect y ManualSigmas (#5025)#
Define la ruta de eliminación de ruido. La variante elegida Euler Ancestral CFG++ proporciona detalles nítidos con movimiento suave para LTX‑2.3. Una escalera de sigma manual corta ayuda a preservar la estructura del fotograma original mientras permite que las zonas outpainted evolucionen coherentemente.
VAEDecodeTiled (#4851)#
Decodifica fotogramas de alta resolución en mosaicos para gestionar VRAM. Si ves artefactos de costura, ajusta el tamaño del mosaico o el solapamiento ligeramente y vuelve a ejecutar. Este nodo es puramente para eficiencia y no cambia el resultado creativo.
VHS_VideoCombine (#5137)#
Combina los fotogramas de video y la pista de audio generada a la tasa de fotogramas heredada. Si prefieres el audio fuente en su lugar, enruta ese audio al combinador y desactiva la pista generada.
Extras opcionales#
- Consejos de instrucciones para LTX 2.3 Outpainting: describe el contenido que debería aparecer específicamente en los nuevos márgenes, agrega verbos de movimiento, dirección de cámara y pistas de iluminación. Mantén las instrucciones negativas cortas y enfocadas en los artefactos visuales que deseas suprimir.
- Geometría de outpaint: comienza con almohadillas laterales pequeñas para un aspecto natural, luego itera hacia la proporción de aspecto final. Las máscaras difuminadas se mezclan mejor que los bordes duros al extender cielos, agua o follaje.
- Texto-a-video vs imagen-a-video: establece
bypass_i2ventruepara outpainting impulsado por texto de LTX 2.3,falsecuando deseas que el fotograma original ancle el estilo y el diseño. - Referencias y fuentes: pesos LTX‑2.3 e integración en ComfyUI GitHub y Hugging Face; preprocesador de outpaint estilo VACE GitHub.
Agradecimientos#
Este flujo de trabajo implementa y se basa en los siguientes trabajos y recursos. Agradecemos a @CG Pixel, el creador de LTX 2.3 para el Flujo de Trabajo de Outpainting por sus contribuciones y mantenimiento. Para detalles autorizados, consulta la documentación original y los repositorios vinculados a continuación.
Recursos#
- Fuente del Flujo de Trabajo LTX 2.3/Outpainting
- Documentos / Notas de Lanzamiento: YouTube @CG Pixel
Nota: El uso de los modelos, conjuntos de datos y código referenciados está sujeto a las licencias y términos respectivos proporcionados por sus autores y mantenedores.

