Рабочий процесс LTX 2.3 Movie Builder: связное, многосценное, аудиочувствительное создание фильмов в ComfyUI#
Рабочий процесс LTX 2.3 Movie Builder — это система кинематографического создания фильмов с ИИ, которая объединяет интеллектуальные подсказки Qwen/Gemma с видеомоделью LTX‑2.3 для создания связных многосценных фильмов, сюжетных клипов и музыкальных видео. Она автоматизирует планирование сцен, последовательность подсказок и сборку кадров, сохраняя идентичность персонажей, непрерывность движения и кинематографический ритм. Вы можете управлять результатами с помощью только текста, начальных изображений или аудиореференций для синхронизации губ и жестов, сохраняя творческий контроль над стилем, движением камеры, длиной и порядком редактирования.
Создана Mickmumpitz.ai для производственных рабочих процессов, этот граф ComfyUI интегрирует создание начальных изображений с FLUX.2, структурированные речевые подсказки, аудиочувствительную кондиционирование, необязательное латентное повышение разрешения и финальную сборку кадров. Если вам нужна готовая к съемке система, рабочий процесс LTX 2.3 Movie Builder позволяет вам перейти от референсов и строк сценария к завершенному монтажу с минимальными ручными настройками.
Ключевые модели в рабочем процессе LTX 2.3 Movie Builder в Comfyui#
- Lightricks LTX‑2.3 22B (только трансформер, FP8): основная текстово-видео основа, используемая для генерации изображений и видео. Model
- LTX‑2.3 Distilled LoRA 384 1.1: дистиллированные веса, которые ускоряют и стабилизируют выборку LTX‑2.3. LoRA
- LTX‑2.3 Spatial Upscaler x2 1.1: необязательное латентное повышение разрешения для более чистых, крупных видео. Model
- LTX‑2.3 Video VAE (BF16) и Audio VAE (BF16): VAE для LTX видео и аудиолатентов. Video VAE · Audio VAE
- LTX‑2.3 ID LoRA TalkVid 3k: идентификационно-осведомленная LoRA, которая улучшает идентичность речи и движения рта. LoRA
- Gemma 3 12B IT + LTX‑2.3 Text Projection: стек кодирования текста, используемый для подсказок LTX. Encoder · Projection
- FLUX.2‑klein‑9B FP8: быстрый генератор изображений для начальных кадров, реквизита и разработки внешнего вида. Model
- FLUX.2‑klein‑9B Consistency LoRA V2 и 360 ERP Outpaint LoRA: улучшение временной устойчивости и широкого контекста в ресурсах. Consistency · 360 ERP
- Flux2 VAE и Qwen 3 8B кодировщик текста для FLUX: кодировщики, используемые в пути создания ресурсов. Flux2 VAE · Qwen 3 8B
- Необязательный путь с низким VRAM: LTX‑2.3 GGUF квантованный UNet. GGUF
Как использовать рабочий процесс LTX 2.3 Movie Builder в Comfyui#
В двух словах: выберите разрешение фильма и fps, загрузите изображения главных героев (лицо/тело), добавьте необязательную голосовую ссылку, создайте начальный кадр с FLUX или предоставьте свое собственное изображение, напишите структурированную подсказку, затем отрендерите кадр. Дублируйте кадр для новых сцен и переставляйте их в сборщике, чтобы экспортировать финальный фильм.
НАСТРОЙКИ#
Установите ваш видео холст и ритм в LtxResolutionPicker (#13492) и Frame Rate (#13480). Глобальные элементы управления выборкой находятся в Set_steps (#845) и Set_cfg (#851) и влияют как на создание ресурсов, так и на генерацию видео LTX. Если вы работаете только с изображениями, переключите ENABLE / DISABLE VIDEO GENERATION (#13715) для экономии времени. Эти настройки определяют, как долго длится каждый клип и как он компонуется в финальную временную шкалу.
ЗАГРУЗКА МОДЕЛЕЙ LTX#
Стек LTX загружается с UNETLoader (#13450), двумя узлами Load Distilled LoRA (#10370, #10159) и ID LoRA LoraLoaderModelOnly (#10324) для сохранения целостности персонажей. Подсказки кодируются DualCLIPLoader (#13451) с использованием Gemma + LTX проекции. Видео и аудио VAE загружаются через VAELoader (#13449) и VAELoader (#13832), и необязательное латентное повышение разрешения предоставляется LatentUpscaleModelLoader (#10349). Граф хранит их как переиспользуемые значения "Get/Set", так что каждый кадр считывает один и тот же набор моделей.
ЗАГРУЗКА МОДЕЛЕЙ FLUX#
Для создания начальных изображений и разработки внешнего вида путь FLUX загружает UNETLoader (#1992) с Consistency и 360 ERP LoRAs (LoraLoaderModelOnly #6228, #13261). Текст кодируется с помощью CLIPLoader (#362) с использованием Qwen, а изображения декодируются с помощью VAELoader (#360). Этот этап независим, поэтому вы можете быстро экспериментировать с реквизитом, окружением или установочными кадрами, прежде чем передать их LTX.
ЗАГРУЗКА ИЗОБРАЖЕНИЙ ГЛАВНЫХ ГЕРОЕВ#
Добавьте свои ссылки на лицо и тело с помощью LoadImage (#4867, #1284) и сопутствующего набора (#13472, #13473), если это необходимо. Встроенная цепочка инструментов "REMOVE BG" автоматически обрезает лица и удаляет фоны, чтобы создать наборы FACE, BODY и FACEBODY (Set_FACE #3093, Set_BODY #3291, Set_FACEBODY #1334). Чистые ссылки критически важны для сохранения идентичности на протяжении всех кадров.
СОЗДАТЕЛЬ РЕСУРСОВ (необязательный)#
Если вы хотите, чтобы рабочий процесс создал точное начальное изображение, напишите описание в Text Prompt (#13442) и выполните выборку FLUX KSampler (#13361). Полученный кадр кэшируется как OUT_01 и сохраняется через SaveImage (#13439), затем опционально гармонизируется с вашими ссылками с помощью ColorMatch (#13478). Это становится визуальным якорем для последующего прохождения изображения в видео.
АУДИО РЕФЕРЕНЦИЯ (необязательная)#
Загрузите голосовую или исполнительскую реплику с помощью LoadAudio (#10343) и обрежьте ее в TrimAudioDuration (#10344); предварительно просмотрите с помощью PreviewAudio (#10346). Аудио передается в LTXVReferenceAudio (#13329), когда включена Enable Voice Reference (#13320), направляя формы рта, фразы и ритмы жестов. Доступен второй слот для ссылок (AUDIO REFERENCE 02), если вы хотите сравнить или сменить дубли во время итерации.
КАДР 01#
Каждый кадр считывает модели и настройки из общего пула, затем объединяет ваши ресурсы, подсказку и опциональное аудио в видео. Введите кинематографическое описание или подсказку, основанную на речи, в Text Prompt (#13384); используйте включенный формат [VISUAL] / [SPEECH] / [SOUNDS] для наилучших результатов. Начальное изображение предварительно обрабатывается в LTXVPreprocess (#13308) и анимируется в LTXVImgToVideoInplace (#13289), с аудиокондционированием, предоставляемым LTXVReferenceAudio (#13329), когда это включено. Пайплайн выполняет двухэтапную выборку (SamplerCustomAdvanced #13316, #13331) и, если включено Enable Upscale (#13322), уточняет детали с помощью LTXVLatentUpsampler (#13306). CreateVideo (#13310) смешивает кадры и аудио; вы можете сохранить выходные данные по кадрам через ShotVideoOutput (#13379) и Video Output (#13393).
ИТОГОВЫЙ ВЫХОД ФИЛЬМА#
Упорядочьте порядок кадров с помощью вспомогательных узлов MickmumpitzShotOrder (#8230) и MickmumpitzShotDuplicator (#6357), затем соберите ваш монтаж в Video Output - Shot Assembler (#5598). Ассемблер обрезает и объединяет клипы, готовя единую временную шкалу для экспорта. Отрендерите финальный фильм с помощью Video Output (#5521). Чтобы создать более длинные фильмы, дублируйте КАДР 01, настройте подсказки и позиции начала/конца, а затем повторно экспортируйте.
Ключевые узлы в рабочем процессе LTX 2.3 Movie Builder в Comfyui#
LTXVImgToVideoInplace (#13289)#
Преобразует высококачественное изображение в временно согласованное видео латентное, сохраняя идентичность и композицию. Используйте его для преобразования начальных изображений, созданных FLUX, или ваших собственных ссылок в движение. Сопоставьте его с четким направлением сцены в Text Prompt и сохраняйте тот же seed для всех дублируемых дублей, когда вы хотите получить сравнимые альтернативы.
LTXVReferenceAudio (#13329)#
Внедряет временные и фонемные подсказки из голоса или музыкальной основы, чтобы речь и жесты естественно согласовывались. Лучше всего работает с подсказками, которые разделяют [VISUAL], [SPEECH] и [SOUNDS]. Переключите Enable Voice Reference, чтобы переключаться между управляемым аудио и чисто подсказочным движением.
LTXVLatentUpsampler (#13306)#
Уточняет детали в латентном пространстве с использованием пространственного повышающего разрешение LTX‑2.3 для более четких текстур и краев. Включите его, когда кадры будут перемежаться с крупными планами или текстовыми наложениями; отключите его, чтобы быстрее итеративно работать во время разработки внешнего вида.
ColorMatch (#13478)#
Сопоставляет цвет между вашим начальным изображением и эталонным выходом, чтобы поддерживать непрерывность между сценами. Полезно при компоновке нескольких активов, созданных FLUX, или при смешивании настроек освещения.
KSampler (#13361)#
Генератор активов FLUX, который создает реквизит, локации и главные кадры для видеоэтапа. Заблокируйте seed, чтобы сохранить согласованный визуальный язык между последовательностями, затем изменяйте текст, чтобы исследовать небольшие изменения стиля, не нарушая непрерывности.
Video Output - Shot Assembler (#5598)#
Собирает отдельные рендеры кадров и выводит единый монтаж. Используйте его для перестановки сцен, обрезки последовательно и экспорта фильма за один проход.
Необязательные дополнения#
- Используйте структуру подсказок, показанную в подсказке графа: [VISUAL] описание сцены, [SPEECH] точные слова, [SOUNDS] вокальный стиль и атмосфера. Это помогает текстовым и аудиокодировщикам LTX сотрудничать.
- Поддерживайте стабильность идентичности персонажа, предоставляя как ссылки на лицо, так и на тело, и включая ID LoRA LTX‑2.3.
- Для быстрого итеративного процесса отключите повышающее разрешение и голосовую ссылку, сократите длину кадра и используйте видеобайпас для генерации только начальных кадров.
- На системах с низким VRAM попробуйте сборку GGUF LTX‑2.3 и избегайте наложения дополнительных LoRA до финальных проходов. GGUF
- Дублируйте КАДР 01 для новых сцен, минимально изменяйте подсказки между кадрами и используйте те же seed, чтобы поддерживать стабильность тона и освещения от кадра к кадру во всем вашем рабочем процессе LTX 2.3 Movie Builder.
Благодарности#
Этот рабочий процесс реализует и основывается на следующих работах и ресурсах. Мы с благодарностью признаем Mickmumpitz за LTX 2.3 Movie Builder Workflow Source за их вклад и поддержку. Для получения авторитетных деталей, пожалуйста, обращайтесь к оригинальной документации и репозиториям, указанным ниже.
Ресурсы#
- Mickmumpitz/LTX 2.3 Movie Builder Workflow Source
- Документы / Примечания к выпуску: mickmumpitz.ai/posts/new-video-free-i-157336696
Примечание: использование упомянутых моделей, наборов данных и кода подчиняется соответствующим лицензиям и условиям, предоставленным их авторами и поддерживающими.

