LTX 2.3 Edit Anything: flujo de trabajo de edición de video a video basado en prompts para ComfyUI#
Este flujo de trabajo convierte una solicitud de edición en inglés simple en una edición de video temporalmente coherente usando LTX-2.3 con el LTX 2.3 Edit Anything LoRA. En lugar de regenerar una escena, se ancla en tu clip de entrada y aplica cambios localizados o globales mientras preserva el movimiento, las identidades y el tiempo. Los usos típicos incluyen inserción o eliminación de objetos, limpieza de fondos, reemplazos dirigidos y restyling creativo.
El gráfico agrupa la normalización de prompts, la condición de guía de fotogramas y una ruta de generación de un solo paso seguida de interpolación de fotogramas opcional y anti-aliasing. Puedes exportar el clip editado y una comparación lado a lado con la fuente. LTX 2.3 Edit Anything es el centro de este flujo de trabajo: proporciona un control de edición amplio y basado en prompts mientras mantiene el aspecto de alta fidelidad de LTX-2.3.
Modelos clave en el flujo de trabajo Comfyui LTX 2.3 Edit Anything#
- LTX-2.3 transformador de difusión de video base por Lightricks. Espina dorsal de generación de video que predice fotogramas temporalmente consistentes a partir de texto y guías. Model card • Repo
- LTX 2.3 Edit Anything LoRA. LoRA especializada en ediciones que permite operaciones de añadir/eliminar/reemplazar/estilizar sin perder la estructura de la escena. Model
- LTX-2.3 LoRA destilada 384. Destilación que permite horarios de muestreo más cortos mientras preserva la calidad; útil cuando deseas ediciones más rápidas. Model
- Codificador de texto Instruct Gemma 3 12B + proyección de texto LTX-2.3. Codifica la leyenda normalizada en embeddings de condicionamiento para LTX-2.3. Files
- VAE de Video y VAE de Audio LTX-2.3. Comprimen y decodifican latentes de video y audio usados a lo largo de la tubería. Files
- Escaladores Espaciales y Temporales LTX-2.3. Escaladores latentes opcionales para fotogramas más nítidos y movimiento más estable cuando apuntas más allá de la resolución de primer paso. Spatial x2 • Temporal x2
- RIFE (Estimación de Flujo Intermedio en Tiempo Real). Modelo de interpolación de fotogramas que duplica el FPS de reproducción para un movimiento más suave en la exportación final. Repo • ComfyUI extension
Cómo usar el flujo de trabajo Comfyui LTX 2.3 Edit Anything#
A un alto nivel, cargas un video, describes la edición y ejecutas la generación. El flujo de trabajo normaliza tu solicitud en una leyenda estilo entrenamiento, condiciona LTX-2.3 con fotogramas de guía del clip fuente y muestrea un resultado editado. El post-procesamiento opcional interpola fotogramas y aplica anti-aliasing adaptativo antes de la exportación.
Configuraciones de Video#
Usa este grupo para definir el tiempo de clip y el tamaño de salida. Establece FPS y Duración (Segundos) para que coincidan con tu objetivo; el gráfico calcula un conteo de fotogramas alineado para un muestreo estable. Elige Resolución (Dimensión más larga) para tu lado largo objetivo, luego establece opcionalmente Factor de Escalado de Video si deseas un primer paso más rápido y pequeño. Si planeas mantener un solo paso, prefiere un factor de 1.0 para una salida de tamaño nativo.
Entradas#
Carga tu clip fuente en VHS_LoadVideo y deja que el flujo de trabajo maneje el redimensionamiento. Los fotogramas se redimensionan al lado largo elegido y opcionalmente se reducen para velocidad, luego pasan por LTXVPreprocess para prepararse para LTX-2.3. La misma entrada se almacena como un "video de control" que luego ancla movimiento y contenido para que la edición siga la escena original.
Prompt#
Ingresa tu solicitud en Describe the task here (Prompt). Un paso incorporado TextGenerate lo reescribe en una sola leyenda estilo dataset como “Elimina el pequeño coche rojo en el fondo.” La leyenda normalizada se muestra en "Final Prompt" y luego se codifica para el condicionamiento. También puedes escribir una leyenda exacta en el codificador de "Manual Prompt" si prefieres un control total.
Modelo#
El cargador inicializa la espina dorsal LTX-2.3 y adjunta LoRAs. Usa el modelo base para fidelidad general y añade el LTX 2.3 Edit Anything LoRA para editabilidad. Opcionalmente incluye el LoRA destilado si deseas horarios más cortos mientras mantienes la coherencia. Los VAEs de video y audio se preparan aquí para la codificación/decodificación latente.
Generar Baja Resolución#
El flujo de trabajo convierte tu leyenda en condicionamiento positivo/negativo y establece la tasa de fotogramas de video para que la guía temporal coincida con tu objetivo. LTXVAddGuideMulti inyecta información de guía del video de control, lo que ayuda a preservar identidades, diseño y movimiento mientras se aplica la edición. Un sampler personalizado luego desruida el ruido guiado hacia un latente AV editado, equilibrando la adherencia al prompt con la preservación de la estructura. Después del muestreo, el latente de video se decodifica para producir los fotogramas editados de primer paso.
Latente Vacío#
Esta ruta prepara latentes de audio/video usados por el sampler. Por defecto, un latente de audio vacío se concatena para que puedas renderizar incluso cuando no editas audio. Para localizar ediciones, SolidMask junto con SetLatentNoiseMask puede restringir dónde se inyecta nuevo ruido, lo cual es útil para reemplazar un solo objeto sin tocar el resto de la escena.
Audio#
Si tu clip fuente incluye audio, puede pasarse sin cambios; de lo contrario, el gráfico crea una pista silenciosa para una exportación confiable. También puedes cargar o grabar audio personalizado y recortarlo para que coincida con tu duración. Para ediciones enfocadas puramente en lo visual, puedes eliminar el audio de los pasos finales de combinación.
Resultado de 1 Paso#
Esta área previsualiza los fotogramas editados y monta una comparación lado a lado "antes vs después" usando el video de control. Es ideal para verificar rápidamente si el prompt LTX 2.3 Edit Anything apuntó a la región correcta, preservó el movimiento y respetó la composición de la escena. Puedes exportar esta comparación como un artefacto compartible rápidamente.
Post-Procesamiento#
Si deseas un movimiento más suave, la etapa RIFE VFI interpola entre fotogramas para duplicar el FPS. VideoAdaptiveAA luego aplica un ligero anti-aliasing para limpiar bordes antes de la codificación final. El exportador escribe el resultado al doble del FPS original para que el movimiento se sienta natural sin aumentar el costo inicial de muestreo.
Nodos clave en el flujo de trabajo Comfyui LTX 2.3 Edit Anything#
TextGenerate (#178)#
Convierte solicitudes informales en una sola leyenda estilo entrenamiento que LTX-2.3 entiende bien, mejorando la precisión de la edición y la estabilidad temporal. Úsalo cuando desees una fraseología consistente en los proyectos; si necesitas un redactado exacto, ingrésalo directamente en "Manual Prompt." Referencia: el manejo de prompts de LTX-2.3 en el repo oficial proporciona el contexto más amplio para el comportamiento de condicionamiento. Docs
LTXVConditioning (#51)#
Empaqueta el condicionamiento positivo y negativo con la tasa de fotogramas prevista para que los tokens temporales se alineen con tu clip. Mantén el frame_rate consistente con tu exportación para evitar desviaciones; esto ayuda a LTX 2.3 Edit Anything a preservar el movimiento mientras aplica el cambio. Rara vez necesitas negativos pesados; negativos concisos pueden ser suficientes para suprimir artefactos no deseados.
LTXVAddGuideMulti (#104)#
Adjunta uno o más fotogramas de guía del video de control al latente para que la edición siga la estructura y el tiempo originales. Cambiar qué fotograma guías puede afectar la preservación de la identidad y la consistencia de la pose. Para ediciones localizadas, empareja esto con una máscara para que solo la región objetivo reciba ruido significativo.
SetLatentNoiseMask (#75)#
Define dónde se permite al sampler añadir o mantener ruido, controlando efectivamente las regiones de edición. Una máscara completamente blanca edita todo el fotograma; las máscaras suaves son ideales para mezclar reemplazos en fondos ocupados. Reemplaza SolidMask con una máscara pintada cuando necesites un control espacial preciso.
SamplerCustomAdvanced (#38)#
Conduce el proceso de desruido usando tu sampler y horario elegidos. Los horarios más cortos son más rápidos pero se benefician del LoRA destilado; los más largos pueden aumentar la adherencia a costa de tiempo. Si deseas un aspecto o perfil de estabilidad diferente, prueba samplers alternativos manteniendo la misma configuración de guía. Referencia: los documentos del sampler ComfyUI explican cómo interactúan el sampler y los horarios sigma. ComfyUI
RIFE VFI (#205)#
Interpola fotogramas intermedios para aumentar la suavidad sin volver a muestrear el modelo de difusión. Es un paso posterior que preserva el contenido mientras mejora la cadencia del movimiento. Referencia: modelo RIFE e integración ComfyUI. Model • Extension
Extras opcionales#
- Ediciones locales primero: Usa una máscara pintada con
SetLatentNoiseMaskpara restringir firmemente dónde LTX 2.3 Edit Anything aplica cambios, luego amplía la máscara si los bordes se ven demasiado afilados. - Iteración más rápida: Reduce
Factor de Escalado de Videopara pruebas rápidas, luego regresa a1.0para la renderización final o añade los escaladores espaciales/temporales para mayor nitidez. - Fuentes sin audio: Si la entrada no tiene audio, desactiva el audio en la combinación final para evitar errores de muxing, o proporciona una pista silenciosa a través de los nodos proporcionados.
- Nota de programación: El horario "bong_tangent" mostrado en el gráfico requiere el paquete de nodos RES4LYF; si lo seleccionas, instala la extensión primero. Repo
- Comparaciones: Usa la exportación lado a lado incorporada para verificar que las identidades, iluminación y movimiento de cámara se preserven antes de comprometerte con renders largos.
Esta plantilla ComfyUI empareja la espina dorsal de alta fidelidad de LTX-2.3 con el LTX 2.3 Edit Anything LoRA para que puedas añadir, eliminar, reemplazar o restylear elementos en un clip mientras mantienes el ritmo de la escena intacto.
Agradecimientos#
Este flujo de trabajo implementa y se basa en los siguientes trabajos y recursos. Agradecemos profundamente a LTX por LTX 2.3 Edit Anything Workflow Source por sus contribuciones y mantenimiento. Para obtener detalles autorizados, consulta la documentación y los repositorios originales vinculados a continuación.
Recursos#
- LTX/LTX 2.3 Edit Anything Workflow Source
- Docs / Notas de lanzamiento @Benji’s AI Playground: LTX 2.3 Edit Anything Workflow Source
Nota: El uso de los modelos, conjuntos de datos y código referenciados está sujeto a las respectivas licencias y términos proporcionados por sus autores y mantenedores.


