LTX 2.3 MSR рабочий процесс видео с несколькими субъектами для ComfyUI#
Этот рабочий процесс превращает несколько ссылок на персонажей или объекты в одно, согласованное, готовое к истории видео с использованием LTX 2.3 MSR. Он сохраняет идентичность нескольких субъектов, используя аудио-визуальную модель LTX-2.3 для движения, кинематографии и синхронизированного звука. Создатели могут комбинировать до четырех изображений субъектов плюс фон, затем направлять сцену с помощью подсказок для диалогов, групповых кадров и динамических жизненных последовательностей.
Создан для рассказчиков, рекламодателей и создателей контента в социальных сетях, график собирает ссылки в руководство MSR, вводит идентичность через проход LoRA, обусловленный изображением, и образцы латентного аудио-визуального, которые декодируются в кадры и опциональное аудио. LTX 2.3 MSR является якорем для верности идентичности; остальная часть конвейера обрабатывает состав, руководство движением и экспорт.
Ключевые модели в рабочем процессе ComfyUI LTX 2.3 MSR#
- LTX-2.3 22B distilled (1.1) от Lightricks. Базовая аудио-визуальная модель, которая генерирует движение, визуальные эффекты и синхронизированный звук. Веса опубликованы на Hugging Face под LTX-2.3. Lightricks/LTX-2.3
- Gemma 3 12B Instruct текстовый энкодер (fp4 mixed). Используется для кодирования подсказок в стеке LTX для перевода текста в сигналы кондиционирования для генерации. Упакован с активами LTX для ComfyUI. Comfy-Org/ltx-2
- LTX 2.3 MSR LoRA (Licon MSR V1). LoRA для нескольких субъектов, специализированная для LTX-2.3, которая закрепляет несколько идентичностей одновременно, стабилизируя лица, одежду и особенности объектов по всему клипу. liconstudio/ComfyUI-Licon-MSR
- LTX-2 Audio VAE. Обеспечивает латентное аудиопространство и декодирование, используемые при генерации или прикреплении синхронизированного звука с активами LTX-2.x. Comfy-Org/ltx-2
Как использовать рабочий процесс ComfyUI LTX 2.3 MSR#
Этот график имеет три фазы: создание руководства MSR из ссылок, кондиционирование латентного видео с многократным изображением и подсказками, затем выборка и декодирование в кадры и аудио.
- Comfig
- Установите ваши
width,height, общее количествоframesиfpsв узлах конфигурации. Эти параметры подают пустые латенты видео и аудио и этап экспорта, сохраняя синхронизацию от кондиционирования до финального рендера. - Выберите соотношение и продолжительность, которые подойдут вашей истории. Большее количество кадров увеличивает непрерывность движения, но также VRAM и время выполнения.
- Установите ваши
- Загрузчики ссылок
- Загрузите до четырех изображений субъектов (
img1,img2,img3,img4) и фон (bg). Эти параметры сопоставляются с геттерамиrefimg1..4иrefbg, чтобы вы могли быстро менять источники без переподключения. - Используйте четкие, хорошо освещенные изображения с центральным и не перекрытым субъектом. Для одежды или реквизита, которые вы хотите сохранить, убедитесь, что они видны хотя бы на одной ссылке.
- Загрузите до четырех изображений субъектов (
- Композитор MSR
LiconMSR(#28) собирает ссылки на субъектов и фон в один выходной MSR-изображение. Это становится визуальным шаблоном идентичности для LTX 2.3 MSR, выравнивая черты лица, наряды и детали объектов перед выборкой.- Маленький
VHS_VideoCombine(#66) создает быструю предварительную низковременную предварительную версию из выходного MSR для проверки композиции перед запуском полного рендера.
- Кондиционирование с многократным руководством
LTXVAddGuideMulti(#108) поглощает до пяти изображений (ваши четыре субъекта плюс фон) вместе с положительными и отрицательными подсказками для создания начального латентного видео с пространственным и визуальным руководством.- Положительный текст подсказки описывает сцену, камеру и атмосферу; отрицательный текст избегает артефактов и нестилевых видов.
LTXVConditioning(#7) прикрепляет вашfps, чтобы время движения соответствовало экспортеру.
- Контроль идентичности LoRA
- LTX 2.3 MSR LoRA загружается в модель, и
LTXAddVideoICLoRAGuide(#9) применяет проход LoRA, обусловленный изображением, используя MSR-изображение. Это усиливает идентичность по кадрам без замораживания движения. - Используйте этот этап для балансировки силы идентичности со свободой для естественного движения и выражений.
- LTX 2.3 MSR LoRA загружается в модель, и
- Выборка
- Стек выборщиков использует
CFGGuider(#37),KSamplerSelect(#13),ManualSigmas(#27) иRandomNoise(#15), подаваяSamplerCustomAdvanced(#16). Результат - совместное аудио-визуальное латентное, отражающее ваши ссылки, подсказки и ограничения MSR. - Если вам нужны новые вариации, измените семя шума или выборщик, сохраняя ссылки и настройки MSR для согласованности.
- Стек выборщиков использует
- Руководство по обрезке и декодированию
LTXVCropGuides(#17) регулирует латентное видео до вашего целевого размера кадра, избегая ненужных обрезок. Латенты видео и аудио затем разделяютсяLTXVSeparateAVLatent(#24).VAEDecode(#38) конвертирует латенты видео в кадры;LTXVAudioVAEDecode(#25) реконструирует аудио.
- Экспорт
VHS_VideoCombine(#96) собирает кадры и опциональное аудио в H.264 MP4 на выбранном вамиfps, используя вашfilename_prefix. Это финальное видео, произведенное рабочим процессом LTX 2.3 MSR.
Ключевые узлы в рабочем процессе ComfyUI LTX 2.3 MSR#
LiconMSR (#28)#
Собирает 1–4 ссылки на субъектов плюс фон в одно руководство MSR. Установите width и height, чтобы соответствовать вашей целевой холсту, чтобы составной гид и финальные кадры выровнялись. Если вы видите смещение идентичности, пересмотрите входные ссылки или увеличьте, насколько ключевые субъекты видны в своих исходных изображениях.
LTXVAddGuideMulti (#108)#
Комбинирует несколько изображений руководства с вашими подсказками для формирования начального латентного видео. Используйте его, чтобы приоритизировать, какие ссылки доминируют в сцене, слегка предпочитая главных субъектов. Держите руководство по фону активным для стабильных окружений и меньшего количества изменений сцены.
LTXAddVideoICLoRAGuide (#9)#
Вводит изображение, обусловленное MSR LoRA, используя составное MSR-изображение. Увеличьте strength, чтобы усилить сохранение идентичности для лиц, одежды или реквизита; уменьшите его, если движение кажется слишком ограниченным. Выбор обрезки должен отражать, где субъекты чаще всего появляются в кадре.
CFGGuider (#37)#
Контролирует, насколько сильно выборщик следует вашим подсказкам. Более высокий cfg улучшает соблюдение текстовых намерений, но может уменьшить разнообразие; умеренные значения сохраняют естественный вид, уважая руководство MSR.
SamplerCustomAdvanced (#16)#
Запускает процесс удаления шума с использованием выбранного вами выборщика, сигм и семени шума. Выборщики в стиле Euler или DPM хорошо работают с LTX-2.3; исследуйте семена для альтернатив, сохраняя те же ссылки для сохранения идентичности.
VHS_VideoCombine (#96)#
Создает финальный MP4 с опциональным аудио. Совместите frame_rate с этапом кондиционирования и установите четкий filename_prefix для версионности. Используйте предварительный просмотр этого узла для проверки темпа и согласованности идентичности перед публикацией.
Дополнительные возможности#
- Подготовьте ссылки с нейтральными, фронтальными углами и минимальным перекрытием; добавьте второй угол для сложных причесок или аксессуаров.
- Держите ссылки на гардероб и реквизит достаточно большими, чтобы текстуры и логотипы были видны; избегайте сильного размытия движения в исходных изображениях.
- Когда идентичность идеальна, но движение жесткое, слегка уменьшите силу руководства LoRA на этапе LTX 2.3 MSR и добавьте подсказки для движения.
- Для более длинных историй увеличьте
framesи держитеfpsпостоянным для сохранения тайминга; для более резких редактирований увеличьтеfpsи сократитеframes. - Используйте ссылку на фон, аналогичную по освещению и перспективе вашей предполагаемой сцене, для уменьшения несоответствий.
Благодарности#
Этот рабочий процесс реализует и основывается на следующих работах и ресурсах. Мы выражаем благодарность проекту LTX за рабочий процесс LTX 2.3 MSR (Multi-Subject Reference) за их вклад и поддержку. Для авторитетных деталей, пожалуйста, обратитесь к оригинальной документации и репозиториям, указанным ниже.
Ресурсы#
- Источник рабочего процесса LTX/LTX 2.3 MSR
- Документы / Примечания к выпуску: RunningHub post
Примечание: Использование указанных моделей, наборов данных и кода подчиняется соответствующим лицензиям и условиям, предоставленным их авторами и поддерживающими.


