ComfyUI>Рабочие процессы>LTX 2.3 Sulphur T2V рабочий процесс | Кинематографический генератор текст-видео

LTX 2.3 Sulphur T2V рабочий процесс | Кинематографический генератор текст-видео

Workflow Name: RunComfy/LTX-2.3-Sulphur-T2V
Workflow ID: 0000...1417
Преобразуйте текстовые подсказки в кинематографические видео сцены с помощью продвинутой системы Sulphur T2V. Создавайте выразительное движение персонажей, тонкие микроэкспрессии лиц и атмосферные окружения, которые оживляют вашу историю. Разработано для создателей, стремящихся к творческому контролю над углами камеры и пространственной глубиной, это настройка обеспечивает детальное повествование и визуальное воздействие. Интегрированное руководство по управлению камерой и дистиллированная генерация делают каждый кадр намеренным. Добейтесь профессионального уровня с минимальной настройкой, сохраняя при этом управляемый художественный поток.

ComfyUI LTX 2.3 Sulphur T2V workflow Workflow

LTX 2.3 Sulphur T2V workflow in ComfyUI | Cinematic Text-to-Video
Want to run this workflow?
  • Fully operational workflows
  • No missing nodes or models
  • No manual setups required
  • Features stunning visuals

ComfyUI LTX 2.3 Sulphur T2V workflow Examples

LTX 2.3 Sulphur T2V рабочий процесс: от подсказки к кино с микроэкспрессиями, настроением и управляемой камерой#

LTX 2.3 Sulphur T2V рабочий процесс превращает хорошо написанные подсказки в кинематографические клипы, подчеркивающие правдоподобные микроэкспрессии, атмосферные детали сцены и движение, управляемое историей. Он сочетает в себе дистиллированный LTX 2.3 генерационный проход с руководством в стиле Sulphur, опциональным руководством по управлению камерой и стабильным декодированием плиток для надежных текст-видео результатов.

Создан для создателей, которые хотят надежные акты и контролируемое движение камеры, эта настройка ComfyUI балансирует между сюжетной точностью и временной стабильностью. Вы можете запускать чистый текст-видео или начинать с неподвижного изображения, затем декодировать стабильный первый проход латентности в чистую последовательность, удобную для редактирования, с временной аудиодорожкой для легкого редактирования.

Ключевые модели в Comfyui LTX 2.3 Sulphur T2V рабочий процесс#

  • Lightricks LTX‑2.3 22B FP8 контрольная точка. Базовая текстово-видео модель, управляющая генерацией и декодированием. Модельное хранилище
  • LTX‑2.3 дистиллированная LoRA. Дистиллированный адаптер, который сохраняет качество, позволяя более быструю, низкошаговую выборку и стабильное движение. Семейство моделей
  • LTX‑2.3 пространственный апскейлер x2. Включен в граф для экспериментов, в то время как путь по умолчанию использует стабильное декодирование первого прохода для более чистых результатов на этой настройке. Апскейлер
  • LTX‑2 19B LoRA Camera Control Dolly Left. Опциональное руководство для устойчивого движения dolly‑in и мягкого параллакса, когда ваша сцена требует этого. LoRA
  • LTX текстовый кодировщик (Gemma 3 12B варианты). Токенизатор и модель встраивания, которая интерпретирует ваши подсказки и заметки. Текстовые кодировщики
  • LTX аудио VAE. Упаковывает немую аудиодорожку, чтобы полученное видео загружалось чисто в NLE. Модельное хранилище
  • Sulphur LoRA (в комплекте). Адаптер стиля и акта, созданный для выразительных, но сдержанных микроэкспрессий и кинематографической цветовой гармонии.

Как использовать Comfyui LTX 2.3 Sulphur T2V рабочий процесс#

Этот рабочий процесс по умолчанию использует стабильный путь первого прохода текст-видео. Он генерирует согласованную видео латентность, разделяет видео и аудио дорожки, декодирует латентность первого прохода с помощью плиточного декодирования VAE, затем упаковывает кадры и немую аудиодорожку в готовый к редактированию видео файл. Латентные узлы апскейла и уточнения остаются в графе для продвинутых экспериментов, но выход по умолчанию обходит эту ветвь для надежности.

Модель#

Группа Модель загружает LTX‑2.3 FP8 контрольную точку, LTX текстовый кодировщик, аудио VAE и адаптеры, используемые на протяжении всего процесса. Дистиллированные и Sulphur LoRA применяются к базовой модели, чтобы сцена точно соответствовала вашим ударам и намерениям лиц. Если вы хотите движение dolly, активируйте LoRA управления камерой в предоставленных узлах LoraLoader. Путь по умолчанию подает основной выборщик через CFGGuider (#42), в то время как ветвь уточнения доступна для ручных экспериментов.

Подсказка#

Напишите свою сцену в поле Prompt (#29) в виде коротких линий ударов плюс краткие заметки камеры. Положительный текст кодируется CLIPTextEncode (#30), в то время как тщательно подобранный отрицательный список в CLIPTextEncode (#41) подавляет CGI блеск, артефакты, дрожь и резкое мерцание. Держите направление игры кратким и специфичным для глаз, плеч и дыхания, чтобы разблокировать микроэкспрессии, на которые настроен этот рабочий процесс. Язык камеры, такой как "медленное ручное dolly‑in" и "мягкий параллакс", хорошо соответствует планировщику и опциональной камере LoRA.

Настройки видео#

Выберите выходные Width, Height, Frame Rate и Length в группе Настройки видео (#40, #25, #26, #27). Внутри рабочий процесс выводит латентность половинного разрешения для генерационного прохода, чтобы улучшить временную согласованность, затем декодирует эту стабильную латентность напрямую. Используйте Switch to Text to Video? (#28), чтобы запустить чистый T2V, или выключите его и подайте начальное изображение через путь предварительной обработки изображения для контролируемого I2V. Размеры должны оставаться на общих кратных для быстрой плиточной декодировки.

Пустая латентность#

EmptyLTXVLatentVideo (#21) создает пустую видео латентность в соответствии с вашими настройками, а LTXVEmptyLatentAudio (#33) создает соответствующую аудио латентность, чтобы контейнерный мультиплексор был дружелюбен к редактору. Если вы хотите начать с изображения, LTXVImgToVideoInplace (#22) может вставить его в латентную временную линию с контролируемой strength. Когда bypass включен, узел выдает чистый текстовый начальный.

Генерация низкого разрешения#

Аудио и видео латентности объединяются LTXVConcatAVLatent (#32) и синхронизируются LTXVScheduler (#47), который устанавливает видео-осведомленный график сигма для плавного движения и путешествия камеры. CFGGuider (#42) объединяет ваши положительные и отрицательные условия с модельным стеком, а SamplerCustomAdvanced (#9) запускает основной генерационный проход. LTXVSeparateAVLatent (#35) затем разделяет клип обратно на видео и аудио латентности; выход по умолчанию использует эту стабильную видео латентность для плиточного декодирования.

Опциональный латентный апскейл#

LTXVLatentUpsampler (#13) применяет LTX x2 пространственный апскейлер из LatentUpscaleModelLoader (#39), сохраняя временную структуру нетронутой. LTXVImgToVideoInplace (#14) повторно оборачивает апскейлинговую видео латентность вместе с существующей аудио дорожкой. Эта ветвь остается доступной, если вы хотите поэкспериментировать с уточнением более высокого разрешения, но она не подключена к выходу по умолчанию.

Опциональное уточнение#

Ветвь уточнения использует CFGGuider (#8) и SamplerCustomAdvanced (#36) с коротким, ручным графиком сигма. Это полезно для продвинутых пользователей, которые хотят протестировать путь высокого разрешения, но выход по умолчанию обходит эту ветвь, потому что стабильное декодирование первого прохода плитками дает более чистые результаты на предоставленной настройке RunComfy.

Выход#

VAEDecodeTiled (#43) декодирует стабильную видео латентность из LTXVSeparateAVLatent (#35), а LTXVAudioVAEDecode (#23) производит немую дорожку, которая делает редакторы счастливыми. CreateVideo (#38) собирает последовательность на выбранной вами частоте кадров, а SaveVideo (#45) записывает ее на диск. Вы получаете готовое к распространению видео со стабильным движением, чистыми градиентами и контролируемым потоком камеры.

Ключевые узлы в Comfyui LTX 2.3 Sulphur T2V рабочий процесс#

LTXVScheduler (#47)#

Организует видео-осведомленную последовательность сигма для первого прохода. Его сдвиги управления влияют на то, насколько сильно движение накапливается между кадрами; более высокие сдвиги подчеркивают путешествие камеры и быстрое движение объекта, в то время как более низкие значения способствуют более устойчивому кадрированию. Если вы активируете LoRA управления камерой, умеренные сдвиги лучше всего подходят, чтобы избежать чрезмерного дрейфа.

LTXVCropGuides (#10)#

Создает каналы условных обрезок из вашего текста, чтобы важные области, особенно лица, разрешались с более высокой точностью. Используйте его, чтобы направлять микроэкспрессии и детали глаз, не перенапрягая глобальный выборщик. Если крупные планы выглядят мягко, ужесточите свои актёрские удары и позвольте Crop Guides выполнить тонкую настройку.

LTXVImgToVideoInplace (#22, #14)#

Преобразует неподвижное изображение в временно согласованную латентность или повторно оборачивает апскейлинговую латентность для опционального уточнения. Управление strength устанавливает, сколько исходного изображения сохраняется в течение временной линии; более низкие значения позволяют больше генеративной адаптации, более высокие значения сохраняют кадрирование и идентичность. Переключите bypass, чтобы чисто переключаться между I2V и чистым T2V.

LTXVLatentUpsampler (#13)#

Применяет LTX x2 пространственный апскейлер внутри латентности, чтобы поднять текстуры и края для опциональных экспериментов по уточнению. Путь экспорта по умолчанию не зависит от этого узла, поэтому вы можете сравнить стабильный выход первого прохода с ветвью уточнения без изменения основной цепочки вывода.

CFGGuider (#42, #8) и KSamplerSelect (#17, #6)#

Эти пары определяют, насколько строго модель следует вашему тексту и насколько агрессивно она выбирает. Держите руководство консервативным для реализма видео; его повышение может увеличить соответствие подсказкам, но может сделать движение жестче или добавить мерцание. Экспорт по умолчанию полагается на основной выборщик для стабильного движения, в то время как вторичный выборщик зарезервирован для опционального тестирования уточнения.

Опциональные дополнения#

  • Напишите от 3 до 6 ударов, которые описывают намерение и язык тела, а не сюжет; микроэкспрессии возникают из конкретных подсказок, таких как "глаза смягчаются" или "плечи расслабляются."
  • Держите язык камеры компактным: один глагол движения плюс субъект, например "медленное dolly‑in на ее лицо" или "мягкий параллакс от припаркованных автомобилей."
  • Если вы хотите статичное кадрирование, отключите LoRA управления камерой и немного уменьшите сдвиги планировщика; для большего путешествия, активируйте LoRA и немного увеличьте сдвиг.
  • Используйте ширину и высоту, которые являются чистыми кратными 32 для предсказуемого плиточного декодирования.
  • Для воспроизводимости зафиксируйте семена в RandomNoise (#2, #1); изменяйте только одно семя при исследовании вариаций.
  • Отрицательная подсказка уже подавляет CGI артефакты и мерцание; держите ее сфокусированной и позвольте вашему положительному тексту нести стиль и намерение.

Признания#

Этот рабочий процесс реализует и строится на основе следующих работ и ресурсов. Мы с благодарностью признаем RunningHub за справку по рабочему процессу, Lightricks за модель LTX 2.3, дистиллированную LoRA и пространственный апскейлер, и LoRA управления камерой, и Comfy-Org за текстовый кодировщик LTX за их вклад и поддержку. Для авторитетных подробностей, пожалуйста, обратитесь к оригинальной документации и репозиториям, указанным ниже.

Ресурсы#

Примечание: Использование упомянутых моделей, наборов данных и кода подчиняется соответствующим лицензиям и условиям, предоставленным их авторами и поддерживающими организациями.

Want More ComfyUI Workflows?

RunComfy
Авторское право 2026 RunComfy. Все права защищены.

RunComfy - ведущая ComfyUI платформа, предлагающая ComfyUI онлайн среду и услуги, а также рабочие процессы ComfyUI с потрясающей визуализацией. RunComfy также предоставляет AI Models, позволяя художникам использовать новейшие инструменты AI для создания невероятного искусства.