LTX 2.3 Movie Builder Workflow no ComfyUI | Multi-Scene AI Filmmaking

ComfyUI LTX 2.3 Movie Builder Workflow Workflow

LTX 2.3 Movie Builder Workflow in ComfyUI | Multi-Scene AI Filmmaking

Want to run this workflow?

Fully operational workflows
No missing nodes or models
No manual setups required
Features stunning visuals

ComfyUI LTX 2.3 Movie Builder Workflow Examples

LTX 2.3 Movie Builder Workflow: produção de filmes coerente, com múltiplas cenas e sensível ao áudio no ComfyUI#

O LTX 2.3 Movie Builder Workflow é um sistema de filmagem IA cinematográfico que combina a inteligência de prompts Qwen/Gemma com o modelo de vídeo LTX-2.3 para produzir filmes coerentes com múltiplas cenas, clipes orientados por histórias e videoclipes musicais. Ele automatiza o planejamento de cenas, a sequência de prompts e a montagem de tomadas, preservando a identidade dos personagens, a continuidade dos movimentos e o ritmo cinematográfico. Você pode obter resultados apenas com texto, inícios de imagem-para-vídeo ou referência de áudio para sincronização labial e temporização de gestos, mantendo o controle criativo sobre estilo, movimento de câmera, duração e ordem de edição.

Construído por Mickmumpitz.ai para fluxos de trabalho de produção, este gráfico do ComfyUI integra a criação de imagens iniciais com FLUX.2, prompts estruturados de fala, condicionamento sensível ao áudio, upscaling latente opcional e um montador de tomadas final. Se você precisa de um pipeline pronto para filmar, o LTX 2.3 Movie Builder Workflow leva você de referências e linhas de roteiro a um corte final com configuração manual mínima.

Modelos principais no Comfyui LTX 2.3 Movie Builder Workflow#

Lightricks LTX-2.3 22B (transformador apenas, FP8): a espinha dorsal primária de texto-para-vídeo usada para geração de imagem-para-vídeo e texto-para-vídeo. Model
LTX-2.3 Distilled LoRA 384 1.1: pesos destilados que aceleram e estabilizam a amostragem do LTX-2.3. LoRA
LTX-2.3 Spatial Upscaler x2 1.1: upscaler latente opcional para vídeos mais limpos e maiores. Model
LTX-2.3 Video VAE (BF16) e Audio VAE (BF16): VAEs para latentes de vídeo e áudio do LTX. Video VAE · Audio VAE
LTX-2.3 ID LoRA TalkVid 3k: LoRA sensível à identidade que melhora a identidade de fala e o movimento da boca. LoRA
Gemma 3 12B IT + LTX-2.3 Text Projection: pilha de codificação de texto usada para prompts LTX. Encoder · Projection
FLUX.2-klein-9B FP8: gerador de imagens rápido para quadros iniciais, adereços e desenvolvimento visual. Model
FLUX.2-klein-9B Consistency LoRA V2 e 360 ERP Outpaint LoRA: melhoram a estabilidade temporal e o contexto amplo em ativos. Consistency · 360 ERP
Flux2 VAE e Qwen 3 8B codificador de texto para FLUX: codificadores usados no caminho de criação de ativos. Flux2 VAE · Qwen 3 8B
Caminho opcional de baixo VRAM: LTX-2.3 GGUF UNet quantizado. GGUF

Como usar o Comfyui LTX 2.3 Movie Builder Workflow#

Em resumo: escolha a resolução e fps do seu filme, carregue imagens do protagonista (rosto/corpo), adicione referência de voz opcional, gere um quadro inicial com FLUX ou forneça seu próprio still, escreva um prompt estruturado e então renderize a tomada. Duplique a tomada para novas cenas e reordene-as no montador para exportar o filme final.

CONFIGURAÇÕES#

Defina seu canvas de vídeo e ritmo no LtxResolutionPicker (#13492) e Frame Rate (#13480). Os controles globais de amostragem estão em Set_steps (#845) e Set_cfg (#851) e afetam tanto a criação de ativos quanto a geração de vídeo LTX. Se você está iterando apenas em stills, ative o bypass ENABLE / DISABLE VIDEO GENERATION (#13715) para economizar tempo. Essas configurações definem quanto tempo cada clipe dura e como ele se compõe na linha do tempo final.

CARREGAR MODELOS LTX#

A pilha LTX carrega com UNETLoader (#13450), dois nós Load Distilled LoRA (#10370, #10159), e o ID LoRA LoraLoaderModelOnly (#10324) para consistência de personagens. Os prompts são codificados por DualCLIPLoader (#13451) usando projeção Gemma + LTX. VAEs de vídeo e áudio carregam via VAELoader (#13449) e VAELoader (#13832), e o upscaler latente opcional é fornecido por LatentUpscaleModelLoader (#10349). O gráfico armazena estes como valores “Get/Set” reutilizáveis, então cada tomada lê o mesmo pacote de modelos.

CARREGAR MODELOS FLUX#

Para criação de imagem inicial e desenvolvimento visual, o caminho FLUX carrega UNETLoader (#1992) com os LoRAs de Consistência e 360 ERP (LoraLoaderModelOnly #6228, #13261). O texto é codificado com CLIPLoader (#362) usando Qwen, e as imagens decodificam com VAELoader (#360). Este estágio é independente, então você pode iterar rapidamente em adereços, ambientes ou tomadas iniciais antes de passá-los para LTX.

CARREGAR IMAGENS DO PROTAGONISTA#

Adicione suas referências de rosto e corpo com LoadImage (#4867, #1284) e o conjunto complementar (#13472, #13473) se necessário. A cadeia de ferramentas embutida “REMOVE BG” recorta automaticamente rostos e remove fundos para produzir conjuntos FACE, BODY e FACEBODY (Set_FACE #3093, Set_BODY #3291, Set_FACEBODY #1334). Referências limpas são críticas para a retenção de identidade em tomadas.

CRIADOR DE ATIVOS (opcional)#

Se você deseja que o fluxo de trabalho crie um still inicial preciso, escreva uma descrição em Text Prompt (#13442) e execute o amostrador FLUX KSampler (#13361). O quadro resultante é armazenado como OUT_01 e salvo via SaveImage (#13439), então opcionalmente harmonizado com suas referências usando ColorMatch (#13478). Isso se torna o âncora visual para a passagem de imagem-para-vídeo subsequente.

REFERÊNCIA DE ÁUDIO (opcional)#

Carregue uma pista de voz ou performance com LoadAudio (#10343) e corte-a em TrimAudioDuration (#10344); visualize com PreviewAudio (#10346). O áudio é passado para LTXVReferenceAudio (#13329) quando Enable Voice Reference (#13320) está ativado, orientando formas da boca, frases e ritmos de gestos. Um segundo slot de referência (AUDIO REFERENCE 02) está disponível se você quiser comparar ou trocar tomadas no meio da iteração.

TOMADA 01#

Cada tomada lê modelos e configurações do pool compartilhado, então combina seus ativos, prompt e áudio opcional em um vídeo. Insira uma descrição cinematográfica ou prompt orientado por fala em Text Prompt (#13384); use o formato incluído [VISUAL] / [SPEECH] / [SOUNDS] para melhores resultados. O still inicial é pré-processado em LTXVPreprocess (#13308) e animado em LTXVImgToVideoInplace (#13289), com condicionamento de áudio fornecido por LTXVReferenceAudio (#13329) quando ativado. O pipeline executa um amostrador de duas etapas (SamplerCustomAdvanced #13316, #13331) e, se Enable Upscale (#13322) estiver ativado, refina detalhes com LTXVLatentUpsampler (#13306). CreateVideo (#13310) combina os quadros e áudio; você pode salvar saídas por tomada via ShotVideoOutput (#13379) e Video Output (#13393).

SAÍDA FINAL DO FILME#

Arranje a ordem das tomadas com os nós auxiliares MickmumpitzShotOrder (#8230) e MickmumpitzShotDuplicator (#6357), então monte seu corte em Video Output - Shot Assembler (#5598). O montador recorta e concatena clipes, preparando uma única linha do tempo para exportação. Renderize o filme final com Video Output (#5521). Para construir filmes mais longos, duplique a TOMADA 01, ajuste prompts e posições de entrada/saída, e re-exporte.

Nós principais no Comfyui LTX 2.3 Movie Builder Workflow#

`LTXVImgToVideoInplace` (#13289)#

Transforma um still de alta qualidade em um latente de vídeo temporalmente consistente enquanto preserva identidade e composição. Use-o para converter inícios feitos pelo FLUX ou suas próprias referências em movimento. Combine-o com direção clara de cena em Text Prompt e mantenha a mesma semente em tomadas quando quiser alternativas comparáveis.

`LTXVReferenceAudio` (#13329)#

Injeta tempo e dicas de fonemas de uma pista de voz ou música para que fala e gestos se alinhem naturalmente. Funciona melhor com prompts que separam [VISUAL], [SPEECH] e [SOUNDS]. Ative Enable Voice Reference para alternar entre movimento guiado por áudio e apenas direcionado por prompt.

`LTXVLatentUpsampler` (#13306)#

Refina detalhes no espaço latente usando o LTX-2.3 Spatial Upscaler para texturas e bordas mais nítidas. Ative-o quando as tomadas forem intercaladas com close-ups ou sobreposições de texto; desative-o para iterar mais rápido durante o desenvolvimento visual.

`ColorMatch` (#13478)#

Combina a cor entre seu still inicial e uma saída de referência para manter a continuidade entre cenas. Útil ao compor múltiplos ativos gerados pelo FLUX ou misturar configurações de iluminação.

`KSampler` (#13361)#

O gerador de ativos FLUX que cria adereços, locais e stills principais para o estágio de vídeo. Bloqueie sementes para manter uma linguagem visual consistente entre sequências, então ajuste o texto para explorar pequenas mudanças de estilo sem quebrar a continuidade.

`Video Output - Shot Assembler` (#5598)#

Coleta renderizações de tomadas individuais e gera um único corte. Use-o para reordenar cenas, recortar consistentemente e exportar o filme em uma única passagem.

Extras opcionais#

Use a estrutura de prompt mostrada na dica do gráfico: descrição da cena [VISUAL], palavras exatas [SPEECH], estilo vocal e ambiente [SOUNDS]. Isso ajuda os codificadores de texto e áudio LTX a cooperarem.
Mantenha a identidade do personagem estável fornecendo referências de rosto e corpo e ativando o LTX-2.3 ID LoRA.
Para iteração rápida, desative o upscaler e a referência de voz, encurte a duração da tomada e use o bypass de vídeo para gerar apenas quadros iniciais.
Em sistemas de baixo VRAM, experimente a build GGUF do LTX-2.3 e evite empilhar LoRAs extras até as passagens finais. GGUF
Duplique a TOMADA 01 para novas cenas, varie minimamente os prompts entre as tomadas e reutilize sementes para manter o tom e a iluminação estáveis de corte a corte em todo o seu LTX 2.3 Movie Builder Workflow.

Agradecimentos#

Este fluxo de trabalho implementa e constrói sobre os seguintes trabalhos e recursos. Agradecemos profundamente a Mickmumpitz pelo LTX 2.3 Movie Builder Workflow Source por suas contribuições e manutenção. Para detalhes autoritativos, consulte a documentação original e os repositórios vinculados abaixo.

Recursos#

Mickmumpitz/LTX 2.3 Movie Builder Workflow Source
- Docs / Release Notes: mickmumpitz.ai/posts/new-video-free-i-157336696

Nota: O uso dos modelos, conjuntos de dados e código referenciados está sujeito às respectivas licenças e termos fornecidos por seus autores e mantenedores.

Want More ComfyUI Workflows?

LTX 2.3 Imagem para Vídeo | Criador de Movimento Cinematográfico

Transforme imagens em vídeos realistas e cinematográficos com movimento suave e consistente.

LTX-2 First Last Frame | Gerador de Vídeo de Quadros-Chave

Transforme quadros estáticos em transições de vídeo e som suaves rapidamente.

LTX-2 ControlNet | Gerador de Vídeo de Precisão

Controle preciso, sincronização perfeita, criação de vídeo de IA super clara.

LTX 2.3 LoRA Inferência | AI Toolkit ComfyUI

Execute seu LTX 2.3 LoRA treinado pelo AI Toolkit no ComfyUI com comportamento compatível com o treinamento usando um único nó personalizado RunComfy RC.

LTX 2.3 Prompt Relay | Criador de Vídeos Controlados por Cena

Transforme imagens estáticas em clipes cinematográficos suaves e guiados por histórias instantaneamente.

Product Relighting Video | Vid2Vid

Insira um vídeo e máscaras de luz para gerar um vídeo de reiluminação

AP Workflow 12.0 | Suíte Completa de Mídia AI Pronta para Uso

Sistema tudo-em-um pré-definido para geração, aprimoramento e manipulação de imagens e vídeos. Nenhuma configuração necessária.

CCSR | Aumentador de Escala Consistente de Imagem/Vídeo

O modelo CCSR aprimora o aumento de escala de imagens e vídeos, concentrando-se mais na consistência do conteúdo.

Suporte

Recursos

Legal

RunComfy

RunComfy é a principal ComfyUI plataforma, oferecendo ComfyUI online ambiente e serviços, juntamente com fluxos de trabalho do ComfyUI apresentando visuais impressionantes. RunComfy também oferece AI Models, permitindo que artistas utilizem as mais recentes ferramentas de AI para criar arte incrível.

LTX 2.3 Movie Builder Workflow | Gerador de Filmes com IA