LTX Video: Генерация видео из текста и изображений+текста

Модель LTX Video и узлы ComfyUI-LTXVideo были разработаны Lightricks. Для получения дополнительной информации о LTX Video и проектах Lightricks, пожалуйста, посетите их GitHub репозиторий.

ComfyUI LTX Video Рабочий процесс

LTX Video: Text and Image+Text to Video Generation

Хотите запустить этот рабочий процесс?

Полностью функциональные рабочие процессы
Нет недостающих узлов или моделей
Не требуется ручная настройка
Отличается потрясающей визуализацией

ComfyUI LTX Video Примеры

LTX Video — это модель генерации видео на основе диффузии, разработанная Lightricks. Она способна генерировать видео из текстовых подсказок (текст-видео) или комбинации изображений и текстовых подсказок (изображение+текст-видео). LTX Video производит видео с частотой 24 кадра в секунду (FPS) и разрешением 768x512 быстрее, чем их можно посмотреть. Модель обучена на крупномасштабном наборе данных, содержащем разнообразные видео, что позволяет ей генерировать реалистичный и разнообразный видеоконтент с высоким разрешением.

Модель LTX Video и узлы ComfyUI-LTXVideo были разработаны Lightricks. Все заслуги в создании LTX Video принадлежат им. Для получения дополнительной информации о LTX Video и проектах Lightricks, пожалуйста, посетите их GitHub репозиторий по адресу https://github.com/Lightricks/LTX-Video или их веб-сайт по адресу https://www.lightricks.com/ltxv.

Техники, лежащие в основе модели LTX#

LTX Video использует подход на основе диффузии для генерации видео. Диффузионные модели работают, постепенно устраняя шум из зашумленного входа на протяжении нескольких временных шагов для генерации окончательного результата. В случае LTX Video модель принимает зашумленное латентное представление в качестве входных данных и итеративно устраняет шум, чтобы создать последовательность кадров видео. Процесс удаления шума управляется предоставленными текстовыми или изображение+текст подсказками, которые контролируют содержание и стиль сгенерированного видео.

Ключевые техники, применяемые LTX Video, включают:

Генерация видео на основе диффузии: Используя диффузионные модели, LTX Video может генерировать высококачественные видео с реалистичным движением и последовательностью кадров.
Синтез текст-видео: LTX Video может генерировать видео, основываясь исключительно на текстовых описаниях, что позволяет пользователям создавать пользовательские видео с нуля, используя естественные языковые подсказки.
Синтез изображение+текст-видео: LTX Video также поддерживает генерацию видео, комбинируя начальное изображение с текстовой подсказкой. Это позволяет пользователям задать начальную точку для видео и управлять его содержанием и стилем с помощью текста.

Как использовать рабочий процесс LTX Video в ComfyUI#

Подготовьте входные данные:
- По умолчанию рабочий процесс — это генерация видео из изображение + текст. Предоставьте начальное изображение вместе с текстовой подсказкой. Изображение служит начальной точкой, и модель будет генерировать видео на основе как изображения, так и сопутствующего текста. Обратите внимание, что эта модель требует длинных, описательных подсказок; если подсказка слишком коротка, качество значительно пострадает.
Настройте параметры модели:
- Установите желаемое разрешение и количество кадров для генерируемого контента. Разрешение должно делиться на 32, а количество кадров должно делиться на 8 + 1 (например, 257 кадров). LTX лучше всего работает с разрешениями ниже 720x1280 пикселей и менее чем 257 кадров.
- Настройте другие параметры, такие как шаги диффузии, график шума и масштаб руководства в соответствии с вашими требованиями. Эти параметры контролируют качество и разнообразие генерируемого результата.
Генерация контента:
- Выходной результат будет иметь указанное разрешение и количество кадров и будет соответствовать предоставленной входной подсказке.

Ограничения модели LTX#

LTX Video не предназначен и не способен предоставлять фактическую информацию.
Как статистическая модель, LTX Video может усиливать существующие общественные предубеждения, присутствующие в обучающих данных.
Сгенерированные видео могут не идеально соответствовать предоставленным подсказкам.
Качество следования подсказкам сильно зависит от стиля подачи подсказок.

Лицензия#

Пожалуйста, используйте модель для целей, разрешенных в **лицензии**

Want More ComfyUI Workflows?

CogVideoX Tora | Модель преобразования изображения в видео

Демонстрация видео с траекторией объекта для CogVideoX

Pyramid Flow | Генерация видео

Включает режимы от текста к видео и от изображения к видео.

MV-Adapter | Генератор многовидового изображения высокого разрешения

Создавайте 360-градусные виды всего из одного изображения или описания.

Flux Krea Dev | Естественное преобразование текста в изображение

Лучшая модель FLUX с открытым исходным кодом! Абсолютно невероятные естественные результаты.

Wan Alpha | Генератор прозрачного видео

Магия альфа: мгновенные видео с прозрачным фоном для VFX и дизайна.

Wan 2.2 VBVR в ComfyUI | Видео-основанное видеорассуждение

Создает умные, последовательные видео с реальной логикой сцены и структурой.

FLUX IP-Adapter | Генерация Изображений с Адаптацией Стиля

Адаптируйте предварительно обученные модели к определённым стилям изображений для создания потрясающих визуалов 512x512 и 1024x1024.

IPAdapter Plus (V2) | Объединение Изображений

Используйте различные методы слияния с IPAdapter Plus для точного и эффективного контроля смешивания изображений.

Подписывайтесь на нас

Поддержка

Ресурсы

Юридическая информация

RunComfy

RunComfy - ведущая ComfyUI платформа, предлагающая ComfyUI онлайн среду и услуги, а также рабочие процессы ComfyUI с потрясающей визуализацией. RunComfy также предоставляет AI Models, позволяя художникам использовать новейшие инструменты AI для создания невероятного искусства.

LTX Video | Изображение+Текст в Видео