ComfyUI>Fluxos de Trabalho>LTX 2.3 Movie Builder Workflow | Gerador de Filmes com IA

LTX 2.3 Movie Builder Workflow | Gerador de Filmes com IA

Workflow Name: RunComfy/LTX-2.3-Movie-Builder
Workflow ID: 0000...1409
Com o sistema LTX 2.3 Movie Builder, você pode construir filmes coesos dirigidos por IA com continuidade entre cenas e qualidade cinematográfica. Ele simplifica o planejamento de cenas e a sequência de prompts, mantendo a consistência dos personagens e dos movimentos. Você pode criar narrativas baseadas em texto-para-vídeo, imagem-para-vídeo e áudio sem configurações manuais complexas. O sistema garante transições suaves de câmera e ritmo realista para projetos de filmes mais longos. Ideal para criadores, ele traz velocidade, estrutura e controle criativo ao seu processo de filmagem com IA.

ComfyUI LTX 2.3 Movie Builder Workflow Workflow

LTX 2.3 Movie Builder Workflow in ComfyUI | Multi-Scene AI Filmmaking
Want to run this workflow?
  • Fully operational workflows
  • No missing nodes or models
  • No manual setups required
  • Features stunning visuals

ComfyUI LTX 2.3 Movie Builder Workflow Examples

LTX 2.3 Movie Builder Workflow: produção de filmes coerente, com múltiplas cenas e sensível ao áudio no ComfyUI#

O LTX 2.3 Movie Builder Workflow é um sistema de filmagem IA cinematográfico que combina a inteligência de prompts Qwen/Gemma com o modelo de vídeo LTX-2.3 para produzir filmes coerentes com múltiplas cenas, clipes orientados por histórias e videoclipes musicais. Ele automatiza o planejamento de cenas, a sequência de prompts e a montagem de tomadas, preservando a identidade dos personagens, a continuidade dos movimentos e o ritmo cinematográfico. Você pode obter resultados apenas com texto, inícios de imagem-para-vídeo ou referência de áudio para sincronização labial e temporização de gestos, mantendo o controle criativo sobre estilo, movimento de câmera, duração e ordem de edição.

Construído por Mickmumpitz.ai para fluxos de trabalho de produção, este gráfico do ComfyUI integra a criação de imagens iniciais com FLUX.2, prompts estruturados de fala, condicionamento sensível ao áudio, upscaling latente opcional e um montador de tomadas final. Se você precisa de um pipeline pronto para filmar, o LTX 2.3 Movie Builder Workflow leva você de referências e linhas de roteiro a um corte final com configuração manual mínima.

Modelos principais no Comfyui LTX 2.3 Movie Builder Workflow#

  • Lightricks LTX-2.3 22B (transformador apenas, FP8): a espinha dorsal primária de texto-para-vídeo usada para geração de imagem-para-vídeo e texto-para-vídeo. Model
  • LTX-2.3 Distilled LoRA 384 1.1: pesos destilados que aceleram e estabilizam a amostragem do LTX-2.3. LoRA
  • LTX-2.3 Spatial Upscaler x2 1.1: upscaler latente opcional para vídeos mais limpos e maiores. Model
  • LTX-2.3 Video VAE (BF16) e Audio VAE (BF16): VAEs para latentes de vídeo e áudio do LTX. Video VAE · Audio VAE
  • LTX-2.3 ID LoRA TalkVid 3k: LoRA sensível à identidade que melhora a identidade de fala e o movimento da boca. LoRA
  • Gemma 3 12B IT + LTX-2.3 Text Projection: pilha de codificação de texto usada para prompts LTX. Encoder · Projection
  • FLUX.2-klein-9B FP8: gerador de imagens rápido para quadros iniciais, adereços e desenvolvimento visual. Model
  • FLUX.2-klein-9B Consistency LoRA V2 e 360 ERP Outpaint LoRA: melhoram a estabilidade temporal e o contexto amplo em ativos. Consistency · 360 ERP
  • Flux2 VAE e Qwen 3 8B codificador de texto para FLUX: codificadores usados no caminho de criação de ativos. Flux2 VAE · Qwen 3 8B
  • Caminho opcional de baixo VRAM: LTX-2.3 GGUF UNet quantizado. GGUF

Como usar o Comfyui LTX 2.3 Movie Builder Workflow#

Em resumo: escolha a resolução e fps do seu filme, carregue imagens do protagonista (rosto/corpo), adicione referência de voz opcional, gere um quadro inicial com FLUX ou forneça seu próprio still, escreva um prompt estruturado e então renderize a tomada. Duplique a tomada para novas cenas e reordene-as no montador para exportar o filme final.

CONFIGURAÇÕES#

Defina seu canvas de vídeo e ritmo no LtxResolutionPicker (#13492) e Frame Rate (#13480). Os controles globais de amostragem estão em Set_steps (#845) e Set_cfg (#851) e afetam tanto a criação de ativos quanto a geração de vídeo LTX. Se você está iterando apenas em stills, ative o bypass ENABLE / DISABLE VIDEO GENERATION (#13715) para economizar tempo. Essas configurações definem quanto tempo cada clipe dura e como ele se compõe na linha do tempo final.

CARREGAR MODELOS LTX#

A pilha LTX carrega com UNETLoader (#13450), dois nós Load Distilled LoRA (#10370, #10159), e o ID LoRA LoraLoaderModelOnly (#10324) para consistência de personagens. Os prompts são codificados por DualCLIPLoader (#13451) usando projeção Gemma + LTX. VAEs de vídeo e áudio carregam via VAELoader (#13449) e VAELoader (#13832), e o upscaler latente opcional é fornecido por LatentUpscaleModelLoader (#10349). O gráfico armazena estes como valores “Get/Set” reutilizáveis, então cada tomada lê o mesmo pacote de modelos.

CARREGAR MODELOS FLUX#

Para criação de imagem inicial e desenvolvimento visual, o caminho FLUX carrega UNETLoader (#1992) com os LoRAs de Consistência e 360 ERP (LoraLoaderModelOnly #6228, #13261). O texto é codificado com CLIPLoader (#362) usando Qwen, e as imagens decodificam com VAELoader (#360). Este estágio é independente, então você pode iterar rapidamente em adereços, ambientes ou tomadas iniciais antes de passá-los para LTX.

CARREGAR IMAGENS DO PROTAGONISTA#

Adicione suas referências de rosto e corpo com LoadImage (#4867, #1284) e o conjunto complementar (#13472, #13473) se necessário. A cadeia de ferramentas embutida “REMOVE BG” recorta automaticamente rostos e remove fundos para produzir conjuntos FACE, BODY e FACEBODY (Set_FACE #3093, Set_BODY #3291, Set_FACEBODY #1334). Referências limpas são críticas para a retenção de identidade em tomadas.

CRIADOR DE ATIVOS (opcional)#

Se você deseja que o fluxo de trabalho crie um still inicial preciso, escreva uma descrição em Text Prompt (#13442) e execute o amostrador FLUX KSampler (#13361). O quadro resultante é armazenado como OUT_01 e salvo via SaveImage (#13439), então opcionalmente harmonizado com suas referências usando ColorMatch (#13478). Isso se torna o âncora visual para a passagem de imagem-para-vídeo subsequente.

REFERÊNCIA DE ÁUDIO (opcional)#

Carregue uma pista de voz ou performance com LoadAudio (#10343) e corte-a em TrimAudioDuration (#10344); visualize com PreviewAudio (#10346). O áudio é passado para LTXVReferenceAudio (#13329) quando Enable Voice Reference (#13320) está ativado, orientando formas da boca, frases e ritmos de gestos. Um segundo slot de referência (AUDIO REFERENCE 02) está disponível se você quiser comparar ou trocar tomadas no meio da iteração.

TOMADA 01#

Cada tomada lê modelos e configurações do pool compartilhado, então combina seus ativos, prompt e áudio opcional em um vídeo. Insira uma descrição cinematográfica ou prompt orientado por fala em Text Prompt (#13384); use o formato incluído [VISUAL] / [SPEECH] / [SOUNDS] para melhores resultados. O still inicial é pré-processado em LTXVPreprocess (#13308) e animado em LTXVImgToVideoInplace (#13289), com condicionamento de áudio fornecido por LTXVReferenceAudio (#13329) quando ativado. O pipeline executa um amostrador de duas etapas (SamplerCustomAdvanced #13316, #13331) e, se Enable Upscale (#13322) estiver ativado, refina detalhes com LTXVLatentUpsampler (#13306). CreateVideo (#13310) combina os quadros e áudio; você pode salvar saídas por tomada via ShotVideoOutput (#13379) e Video Output (#13393).

SAÍDA FINAL DO FILME#

Arranje a ordem das tomadas com os nós auxiliares MickmumpitzShotOrder (#8230) e MickmumpitzShotDuplicator (#6357), então monte seu corte em Video Output - Shot Assembler (#5598). O montador recorta e concatena clipes, preparando uma única linha do tempo para exportação. Renderize o filme final com Video Output (#5521). Para construir filmes mais longos, duplique a TOMADA 01, ajuste prompts e posições de entrada/saída, e re-exporte.

Nós principais no Comfyui LTX 2.3 Movie Builder Workflow#

LTXVImgToVideoInplace (#13289)#

Transforma um still de alta qualidade em um latente de vídeo temporalmente consistente enquanto preserva identidade e composição. Use-o para converter inícios feitos pelo FLUX ou suas próprias referências em movimento. Combine-o com direção clara de cena em Text Prompt e mantenha a mesma semente em tomadas quando quiser alternativas comparáveis.

LTXVReferenceAudio (#13329)#

Injeta tempo e dicas de fonemas de uma pista de voz ou música para que fala e gestos se alinhem naturalmente. Funciona melhor com prompts que separam [VISUAL], [SPEECH] e [SOUNDS]. Ative Enable Voice Reference para alternar entre movimento guiado por áudio e apenas direcionado por prompt.

LTXVLatentUpsampler (#13306)#

Refina detalhes no espaço latente usando o LTX-2.3 Spatial Upscaler para texturas e bordas mais nítidas. Ative-o quando as tomadas forem intercaladas com close-ups ou sobreposições de texto; desative-o para iterar mais rápido durante o desenvolvimento visual.

ColorMatch (#13478)#

Combina a cor entre seu still inicial e uma saída de referência para manter a continuidade entre cenas. Útil ao compor múltiplos ativos gerados pelo FLUX ou misturar configurações de iluminação.

KSampler (#13361)#

O gerador de ativos FLUX que cria adereços, locais e stills principais para o estágio de vídeo. Bloqueie sementes para manter uma linguagem visual consistente entre sequências, então ajuste o texto para explorar pequenas mudanças de estilo sem quebrar a continuidade.

Video Output - Shot Assembler (#5598)#

Coleta renderizações de tomadas individuais e gera um único corte. Use-o para reordenar cenas, recortar consistentemente e exportar o filme em uma única passagem.

Extras opcionais#

  • Use a estrutura de prompt mostrada na dica do gráfico: descrição da cena [VISUAL], palavras exatas [SPEECH], estilo vocal e ambiente [SOUNDS]. Isso ajuda os codificadores de texto e áudio LTX a cooperarem.
  • Mantenha a identidade do personagem estável fornecendo referências de rosto e corpo e ativando o LTX-2.3 ID LoRA.
  • Para iteração rápida, desative o upscaler e a referência de voz, encurte a duração da tomada e use o bypass de vídeo para gerar apenas quadros iniciais.
  • Em sistemas de baixo VRAM, experimente a build GGUF do LTX-2.3 e evite empilhar LoRAs extras até as passagens finais. GGUF
  • Duplique a TOMADA 01 para novas cenas, varie minimamente os prompts entre as tomadas e reutilize sementes para manter o tom e a iluminação estáveis de corte a corte em todo o seu LTX 2.3 Movie Builder Workflow.

Agradecimentos#

Este fluxo de trabalho implementa e constrói sobre os seguintes trabalhos e recursos. Agradecemos profundamente a Mickmumpitz pelo LTX 2.3 Movie Builder Workflow Source por suas contribuições e manutenção. Para detalhes autoritativos, consulte a documentação original e os repositórios vinculados abaixo.

Recursos#

Nota: O uso dos modelos, conjuntos de dados e código referenciados está sujeito às respectivas licenças e termos fornecidos por seus autores e mantenedores.

RunComfy
Copyright 2026 RunComfy. Todos os Direitos Reservados.

RunComfy é a principal ComfyUI plataforma, oferecendo ComfyUI online ambiente e serviços, juntamente com fluxos de trabalho do ComfyUI apresentando visuais impressionantes. RunComfy também oferece AI Models, permitindo que artistas utilizem as mais recentes ferramentas de AI para criar arte incrível.